Gene GM21_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3359
Symbol
ID	8138726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3886915
End bp	3888597
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	64%
IMG OID	644870977
Product	ABC-1 domain protein
Protein accession	YP_003023142
Protein GI	253701953
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.779537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATAGAA TCCTGAACAT CAACCGCAAC GTCCGGAGCA TCCGGCGTTA CCGGCAGATC 
ATCACGGTAA TGGGCGGGTA TGGCCTCGGG CAGTTGCTGG AATACCTGAA CCTGGGGCAG 
GTGGTGGCCT TGTCGCGCCG CATGCTGCGC CGTCCCAGCA AGGCGGCTCA CCTCTCGGCG 
CCGGAGCGCC TGCGCTTGGC CCTCGAGGAA CTGGGGCCGA CCTTCATCAA GCTGGGACAG 
CTCCTCTCCA CCCGCGCCGA CATCATCCCC CCCGCCTTCG TGCAGGAACT GGCGCGCCTG 
CAGGACGAGA TACCCTGCAT CGATTTCGAG GAGATAAAGG TACAGATCGA GCATGAGTTG 
GGGGTACCGC TGGAAAACCG GTTCCTCCGC GTGGAGCCGG TGGCCATCGC CGGGGCGTCG 
ATTGCGCAGG TGCACCGGGC CACGCTCGTC ACCGGGGAGG ACGTGGTGGT GAAGGTGCGC 
CGCCCCGGGG TGATGGGGGC GGTCGAGACC GACATCGACA TCCTGATGGG GGTGGCGCTG 
CTTTTGGAGC GCCACATGGC CAGAAGCGAC ATCTACGACC CGGTTGGGGT GGTGCGGGAA 
TTCTCCTACA CCATCCGGCG CGAAATGGAT CTCTCCCGCG AGGGGCACGC CATCGAGCGT 
ATCCGTGACA ACTTCAAGGG GTACCCCGAC CTTCATTTCC CGCAGGTCTA CTGGGAGGCG 
ACCGCGAAGG GTGTGCTCAC CACCGAGTAC GTGGACGGCA TCAAGGTGAG CGACATCTGC 
GCCATCGAGA AGGCTGGGCT GGACCGGCGC GAGATAGCGC GGCGCGGGGC GACGGCCTTT 
CTGAAGATGG TGCTGGAACA CGGCTTCTTC CACGGCGACC CCCATCCGGG GAACGTGATG 
ATCCTCCCCA ACAACGTGAT CTGCCTGCTC GACTACGGCA TGGTGGGAAG GCTAGACCCC 
GCTGTGAAGC GCTACCTGAC CGACGTCTTG GGCGCGGTGA TCGACCGGGA TGTCGAGGGG 
CTCGCCTACA TCGTAGCGGA GGCCGGCGAC GCGGGCGAGA ACGTCAACAT GCACGCGCTG 
AAAAAGGGGC TCGCCGAGTT CATCGACAGC TACTTCGACA TCCCGCTCAA GGAGATCGTG 
GTGGGGCGCA TGCTCCTGGA GTTCATCGAC CTGGTTTCCA CGCACCGCAT CAAGGTGCAC 
CCGGACCTCA CCATGCTGGT CAAGGTGCTG GTGGTGGTGG AGGGGATGGG GAGAAAGCTC 
GATCCCGATT TCGACATGGT AGGGCACCTG CGGCCGTTCC TGGAGAGGGA GTTCAGGCAG 
CAGCACTCGC CGGGGCGACT TTTGCGCGAG ATGGAGCAGG GGCTGGAGGG ATACCTCACC 
CTGGCGCGCA ACCTGCCGCG GGAGCTGAAG GAGATCCTGA ACAAGATCAA CCGGAACAAG 
TTCCGCATCG ACCTGGAACA CCGGGGGCTG GACCGTTTCA GTAGGGAGCT CGACCGCTCG 
GCGAACCGTG TCTGCCTGAG CCTCATCATA GCCGCGCTGC TGATCGGCTC CTCCATCGCC 
ATGCAGACCA ACCGCGGCCC GATGCTCTGG GGGCTCCCCG TATTCGCCTT TTTCGGCTAC 
AGCTGCGCCG GAATAGTCGG CATCTGGTGG ATGATCGCCA TCCTCCGCTC CGGCAGACTG 
TAG

Protein sequence

MYRILNINRN VRSIRRYRQI ITVMGGYGLG QLLEYLNLGQ VVALSRRMLR RPSKAAHLSA 
PERLRLALEE LGPTFIKLGQ LLSTRADIIP PAFVQELARL QDEIPCIDFE EIKVQIEHEL 
GVPLENRFLR VEPVAIAGAS IAQVHRATLV TGEDVVVKVR RPGVMGAVET DIDILMGVAL 
LLERHMARSD IYDPVGVVRE FSYTIRREMD LSREGHAIER IRDNFKGYPD LHFPQVYWEA 
TAKGVLTTEY VDGIKVSDIC AIEKAGLDRR EIARRGATAF LKMVLEHGFF HGDPHPGNVM 
ILPNNVICLL DYGMVGRLDP AVKRYLTDVL GAVIDRDVEG LAYIVAEAGD AGENVNMHAL 
KKGLAEFIDS YFDIPLKEIV VGRMLLEFID LVSTHRIKVH PDLTMLVKVL VVVEGMGRKL 
DPDFDMVGHL RPFLEREFRQ QHSPGRLLRE MEQGLEGYLT LARNLPRELK EILNKINRNK 
FRIDLEHRGL DRFSRELDRS ANRVCLSLII AALLIGSSIA MQTNRGPMLW GLPVFAFFGY 
SCAGIVGIWW MIAILRSGRL