Gene GM21_1906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1906
Symbol
ID	8137240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2214523
End bp	2215608
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	65%
IMG OID	644869520
Product	Sporulation domain protein
Protein accession	YP_003021717
Protein GI	253700528
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.111594
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAATA AATTCACACC GGATGCGGAC GAGCACGACG AGACCCAAGC GAAGAAGAGT 
TCGCAGCAGC GGCTCCTCCT GCTTCTCTTG CTGCTCATAG CCCTTTTTGC CTATCTATAC 
TTCTTCACCG GCTTGATCAG GCCCCGCGCC GACCAGGCTG CGGCGCCCGC ACCGGAACCG 
GCGGCCCAGC CGGCGTCTGC CGTAGTGAAA AAACCGCTGC CGCCCAGGCC GGAACCGGCC 
TCCGCCGAGG CTACGGCCGG CGCGCCTGCC CCGGGCTCCG CGCCTGCCCC GGGCTCCGCG 
CCTGCCCCGG GCTCCGCGCC TGCCCCGGGA GCGACGCCGG CCGCTCCGGC TAAACCCGCG 
GCTGCCGCCA AACCTGCCGC ACCTGCTAAG GAAGCTAAAC CTGCAACTGC TGCCAAAGTG 
ACAAAGCCGG CTGTACCTGC CAAGGAAGCC AAGCCTGGCG CGGTTGCAAA GCCCACTGCC 
AAGGGGGCTA AACCGGCTGC CGCTGCGAAA CCTGCGACGG CTGCCAAGGA GACAAAACCC 
GCTGCCGGCG CGAAGGACGC GAAAACCGCC ACGGCTGCCA AGGTTGCTCC AGCTAAGGGC 
GCGAAGCCTG CGGCCAAGGC TGCGGCCGGA GCCTATGCCC TGGATATCAA CGGCGACATC 
GCCGAAAGCG AGATGGGACC GGTTACCGCC AAGCTGAAGA AGGCCGGCAT CGCAAACGTG 
GTGAAGACCA AGACGCAAAA GGGGGAGCCG ATGCACCGCT TGTTCCTGGC CGACTTCGGG 
GACAGGAACG AGGCCGTCGA GCAGTTGGTC CGCCTGAAAC AGGTGACCCC CAACGCCTTC 
ATGCTGAAAG AGAACGGCCG GTATGCGGTG TACGGCGGGT CCTTCCTGCG CGAAGGGAAA 
GCTGCCGTGG AGCAGGACCG CCTCTTCGAT AAAGGCGTAA AGCTCATGCT GCAAAAAGCC 
ACCATACCGG TCCCCGTGGT CAAACTGCGG GCCGGTAGCT TCGCCGATCA GGCCAGCGCC 
AAGAAGGCGG CTGCCAAACT GAAGAGCGCC GGGCTCTCCG CCACCGTAGT CAAGGTCGGG 
AAATAG

Protein sequence

MQNKFTPDAD EHDETQAKKS SQQRLLLLLL LLIALFAYLY FFTGLIRPRA DQAAAPAPEP 
AAQPASAVVK KPLPPRPEPA SAEATAGAPA PGSAPAPGSA PAPGSAPAPG ATPAAPAKPA 
AAAKPAAPAK EAKPATAAKV TKPAVPAKEA KPGAVAKPTA KGAKPAAAAK PATAAKETKP 
AAGAKDAKTA TAAKVAPAKG AKPAAKAAAG AYALDINGDI AESEMGPVTA KLKKAGIANV 
VKTKTQKGEP MHRLFLADFG DRNEAVEQLV RLKQVTPNAF MLKENGRYAV YGGSFLREGK 
AAVEQDRLFD KGVKLMLQKA TIPVPVVKLR AGSFADQASA KKAAAKLKSA GLSATVVKVG 
K