Gene GM21_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2038
Symbol
ID	8137374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2362271
End bp	2363410
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	62%
IMG OID	644869653
Product	Extracellular ligand-binding receptor
Protein accession	YP_003021848
Protein GI	253700659
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.000000000000518039
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGAAAAC TCATTACCAC TGCTCTTGCT TTATTTACCT TGCTCTGCCT TTCCACCGTG 
GCCCTGGCCG CCGCTCCCAT CAGGATCGGT GGACTTTTCG CCGTGACCGG CCCAGCCTCC 
TTCCTGGGGG AGCCTGAGCG CAACACCGCG CAGATGGTGG TCAACGAGAT CAACAAGGCG 
GGCGGCGTAA AGGGTCGCAA GATCGAACTG ATCACCTACG ACACCGGCGG TGACGCCACC 
AAAGCGGTGC AACTCGCCAA CAAGCTGATC AAGAACGACA AGGTCGTCGC CATCATCGGT 
CCCAGCACCA CCGGCGACAG CATGGCTATC ATCCCCGTGG TCGAGAGAGC CCGGATACCG 
CTCATCTCCT GCGCAGCCGG GAGCAAGATC ACCGAGCCGG TGAAGAAGTG GGTCTTCAAG 
ACCGCCCAGA ACGACGGCCT GGCAGCCGCC AGGATCTACG AGCAGTTGAG GAAGGAGAGG 
AAGACCAAAG TGGCCATCCT GACCGTCTCC GACGGATTCG GCTCCTCCGG GCGCGAGCAG 
TTGAAGGCCC AGGCGAGGGT CTACGGCATC CAGATACTTT CCGACGACAC CTACGGCCCG 
AAGGACACGG ACATGACCGC GCAGCTCACG AAGATCCGCG GCTCTCAGGC GCAGGCGGTT 
ATCTGCTGGG GCACCAACCC CGGCCCCGCC GTGGTGGCGA GAAACGCGAA GCAGCTCGGC 
CTCAGGATCC CGCTCTACAT GAGCCACGGC GTTTCCTCCA AAAAGTTCAT CCAGCTTGCC 
GGGGACGCGG CCGAGGGGGT CAGACTTCCC TCCGGCAAGG TCCTGGTCGC CGACCTGCTG 
CCCAAGAGCG ACAGGCAGAA GGGGTCGCTC CTTGCCTTCA TCAAGGACTA CCAGAACCAT 
TACAGGGCCG AGGGAGACCA CTTCGGCGGC CATGCCTGGG ACGCGGTGAT GCTCCTGAAA 
GGCACCATCG AGAGGGGAGG GGACACCCCT GTGGGGATCC GCAACGCGCT GGAGGCAACC 
CGCAACTTCG CCGGCATCGG GGGCGTTTTC AACTATTCGA CCAGGGACCA CGCCGGCCTG 
ACGAAAGACG CCTTCACCCT GGTTGAAGTC CGGAAAAAAG ACTGGGTGCT GGTCAAGTAA

Protein sequence

MRKLITTALA LFTLLCLSTV ALAAAPIRIG GLFAVTGPAS FLGEPERNTA QMVVNEINKA 
GGVKGRKIEL ITYDTGGDAT KAVQLANKLI KNDKVVAIIG PSTTGDSMAI IPVVERARIP 
LISCAAGSKI TEPVKKWVFK TAQNDGLAAA RIYEQLRKER KTKVAILTVS DGFGSSGREQ 
LKAQARVYGI QILSDDTYGP KDTDMTAQLT KIRGSQAQAV ICWGTNPGPA VVARNAKQLG 
LRIPLYMSHG VSSKKFIQLA GDAAEGVRLP SGKVLVADLL PKSDRQKGSL LAFIKDYQNH 
YRAEGDHFGG HAWDAVMLLK GTIERGGDTP VGIRNALEAT RNFAGIGGVF NYSTRDHAGL 
TKDAFTLVEV RKKDWVLVK