Gene Arth_1274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1274
Symbol
ID	4446251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1411304
End bp	1412743
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	639689082
Product	HNH endonuclease
Protein accession	YP_830768
Protein GI	116669835
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGGGA ATTCGGGGTC CGAAGCGGTA CCGGCAGCAG TGGAGTGCTG TTGTGCTTGC 
GGCCGGTGGC GTGAGCCTGC AGGGGATGCG TTTGAGGGGG ACGGTGCCCG GCTGATTGAT 
GAGATCCGGG CCTTGGAAAA CCACAAGTCT GCCCTCGCTG CCCGCCAGGC CCGGCTGGCT 
GTCGCATTTG ACCAGCAGCA GCGCCGCCAA CGGTCTGCTG CCGGAGCACC CGCAGACCAA 
TGCGGGGCAG GTGTCGGAGC GCAGATCGCG CTCGCCCGTC GCGAATCCCC GGCTAACGGG 
AGCCGGCTGT TGGGCCTTGC CAAAGCTATG GTGACCGAGA TGCCCCGGAC CCTCGCAGCC 
CTGGAGACCG GGCAGTTGAA CGAGTGGCGG GCCACGTTGT TGGTGCGCGA AACCGCCTGC 
CTGTCGGCGG AGGACCGCTG CGCCGTGGAC GAGGAACTCG CCCCCGACAC CGGCGCCTTT 
GACGGGGCAG GGGACCGCCG AATCATCGCC GCGGTCCGAG CCGCGGCTTA CCGCCGTGAC 
CCCCGTTGTG TCACCCGGAG GGCCAGTCAC GCCGCAGCCG AACGCCACGT CAGCCTTCGT 
CCCGCTCCTG ACACCATGTG CTACCTGACC GCCCTGCTGC CCGTCGCGGC GGGCGTCGCC 
GTTCACGCTG CCCTTGTCCT GAACGCGGAG TCTGTCCGCA GCAGCGGAGA CCCTCGCTCT 
CGCGGACAAA TCATGGCCGA TGACCTGGTC GAACGCGTCA CCGGGACGCC GGGCGGCTTT 
ACAGGCATCG AAATCCAGCT CGTCATGACT GATCGGGCCC TCTTTCAAGG TGACAGCGAA 
CCGGCACGCC TCCCCGGCTA CGGTGTGGTC CCAAGCGGCT GGGCCAGAAA CATCATTGAC 
CGTGGCGGAG CTGCGCCTGC TATCCGGGAT CAAGCCTTCA ACACTTGGAT CCGTCGTCTG 
TACACGGCCC CTGCCACGGG CGAGCTGGTG GCAATGGATT CCCGCGCCCG GCTTTTCCCC 
GCCGGACTCC GCCGCTTCAT CGAGGCACGC GACGACACCT GCCGCACGCC CTTCTGCGAC 
GCCCCCATCC GCCACCTGGA CCACGTCGTC CCCTGGCACG GCGGCGGAGC CACAACACTG 
GACAACGGCG CCGGGCTCTG CGAGGCCTGC AACCACACTA AGGAAGCGCC GGGCTGGAAG 
GCTCACCCGT TGAACGCGCC AAACGCCAAG GGTGGGGCGA GGCATGCCAT CCGGTTGACA 
ACGCCCACCG GCCACAGCTA CCGATCCACT GCACCGCCGT TGCCGGGAAT CCAACGCGGC 
AGCCCGGCCG CCGACTCCGG AGAGCCGGAA GGGGTTCGCC AACGGAAAGA GCTTCGACAT 
CGCGCCAAGA TACACAGGCG AACCGTTCGG TCGCTGCGCG GTGCTCCATG CGCGGCGTAA

Protein sequence

MDGNSGSEAV PAAVECCCAC GRWREPAGDA FEGDGARLID EIRALENHKS ALAARQARLA 
VAFDQQQRRQ RSAAGAPADQ CGAGVGAQIA LARRESPANG SRLLGLAKAM VTEMPRTLAA 
LETGQLNEWR ATLLVRETAC LSAEDRCAVD EELAPDTGAF DGAGDRRIIA AVRAAAYRRD 
PRCVTRRASH AAAERHVSLR PAPDTMCYLT ALLPVAAGVA VHAALVLNAE SVRSSGDPRS 
RGQIMADDLV ERVTGTPGGF TGIEIQLVMT DRALFQGDSE PARLPGYGVV PSGWARNIID 
RGGAAPAIRD QAFNTWIRRL YTAPATGELV AMDSRARLFP AGLRRFIEAR DDTCRTPFCD 
APIRHLDHVV PWHGGGATTL DNGAGLCEAC NHTKEAPGWK AHPLNAPNAK GGARHAIRLT 
TPTGHSYRST APPLPGIQRG SPAADSGEPE GVRQRKELRH RAKIHRRTVR SLRGAPCAA