Gene GM21_2643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2643
Symbol
ID	8137985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3081714
End bp	3083183
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	60%
IMG OID	644870247
Product	ABC transporter related
Protein accession	YP_003022437
Protein GI	253701248
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1119] ABC-type molybdenum transport system, ATPase component/photorepair protein PhrA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	0.031019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAA CCGTGAATAT CATTTTGCAG GACGCAGTAG CCAAGATACA CGATGGGAAA 
AACCTGGAAG GGATTTCTTT TAACATCGAA GCGGATCAGC ATTGGGCCAT CATCGGGGCC 
AACGGGTCGG GGAAGTCGGC GCTGGGGAAA CTGCTTTCCG GCGAGCTGAA GGTGGTTTCC 
GGCCAAGGCC GCATCCCGGG TAAAGCCGGC TACGTCTCCT TCGAAAAGAT CGACGAGATC 
CTGGAAACGG AACGCTACAA CGACGACTCC GATTTTCTCG GCTACGTCAC CCAGGGGACC 
CCTGTCGCCA AGTTCATACT CTCAGGCTCC CAGGCCGACG AAGCGAAATT GCACGATCTT 
GCTCGTGAGA TGGAGTTCAC CGGCATCCTG GAGCGGGGCG TCAAGTTCCT CTCCACCGGA 
GAGATGCGTA AGGCCTTGAT CTGTAAATCT CTCTTGCAGG AACCGGAGCT GCTGGTGCTG 
GACGAGCCGT TCGACGGGCT GGACCAGCAC TCCTGCGAAG TGCTGCGCAC CTTGATCAGC 
CGCTGCATCG GGCGTGGAAT TCAGGTGATC CTGCTCCTGA ACCGCTTCAG CGAGATAGTC 
CCCGAAATCA CGCACGTAGC CTATCTGAAA GAGTGCCGCA TCTTCAGGGC AGGCACCAAG 
GAAGAGATGC TCGAATCCGA GGCGCTGCGC AGGTTCCACG CCTTTCATTA CACCCTTCCC 
GACCGGCTCC CGGAGATCGA CTGCGCGCAC CGCCCTAAGC CGCTTGCCGC CGGAGCGCCG 
TTGGTCCAGA TGAAGGACGT GAAAGTCTCC TACGGCGGGA AACCGATCCT CTCCGGGCTC 
TGCTGGACGG TAAAGCCCGG GGAGCACTGG AAGATAACGG GGCCGAACGG CTCGGGGAAA 
TCCACCCTCT TGAGCCTTGT AAGCGGGGAC AACACCCAGG CCTACGCTAA CGACATCGCT 
CTTTTCGGCA GGAAGCGGGG GACCGGCGAA ACGGTCTGGG ACATAAAGAA GAGGATCGGG 
CTCGTATCCA CCACCCTGCA GCAGGATTAC CGGGTGGGTG GTTCCGCGAA GATGGCGGTG 
GTCTCCGGTT TCTTCGACTC CATCGGCGTC TATTCCGACC CTTCCCCGAG GCAGCTCGAA 
ATAGCTCAGG AATGGCTGGA ACTGCTGCAC ATGGAGCACC GCGCCGGCGA CACCTTCCGC 
GAGCTGTCGT ACGGTGAGCA GAGGCTGGTC CTTTTGGCCC GGGCCATGGT GAAGCAGCCG 
GACCTGTTGA TCCTGGACGA GCCGTGCCAG GGACTGGACG ACGTGAACCG GGAGATGGTG 
CTGAAGCTGG TGGATCACCT GGGAAGGACG GGGAACACGC AGATCCTCTA CGTGAACCAT 
CACGCCGAGG ACCGGATTCC CTGCATCTGC AGGCACATGG AACTGGTCCC CGCCACAGGC 
GGGGGCTACA CCGCCAAAAT CCTCGACTGA

Protein sequence

MDATVNIILQ DAVAKIHDGK NLEGISFNIE ADQHWAIIGA NGSGKSALGK LLSGELKVVS 
GQGRIPGKAG YVSFEKIDEI LETERYNDDS DFLGYVTQGT PVAKFILSGS QADEAKLHDL 
AREMEFTGIL ERGVKFLSTG EMRKALICKS LLQEPELLVL DEPFDGLDQH SCEVLRTLIS 
RCIGRGIQVI LLLNRFSEIV PEITHVAYLK ECRIFRAGTK EEMLESEALR RFHAFHYTLP 
DRLPEIDCAH RPKPLAAGAP LVQMKDVKVS YGGKPILSGL CWTVKPGEHW KITGPNGSGK 
STLLSLVSGD NTQAYANDIA LFGRKRGTGE TVWDIKKRIG LVSTTLQQDY RVGGSAKMAV 
VSGFFDSIGV YSDPSPRQLE IAQEWLELLH MEHRAGDTFR ELSYGEQRLV LLARAMVKQP 
DLLILDEPCQ GLDDVNREMV LKLVDHLGRT GNTQILYVNH HAEDRIPCIC RHMELVPATG 
GGYTAKILD