Gene GM21_2572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2572
Symbol
ID	8137914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3003761
End bp	3005020
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	63%
IMG OID	644870180
Product	hypothetical protein
Protein accession	YP_003022370
Protein GI	253701181
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.718881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCAAGTG TTGAAAATAG GCAGGTAGCT GCGGCGAGGC TCTCTCAGGG CGATTTCCAG 
GCGCTGCCGC TCGACAAGAA GGGGAAGTAC CTGAAGACCG CGCCGGCACG GGAGAAGATG 
GAGCTGATCA TCGCCGACCC GGACGCGAAG AGGGTGGCCG CCACCCTGGA GCCCCAGGAA 
TTTTTCTGGC TGGTCAAGGA GGTGGGCGAG ACCGACGCGC TGGAACTGCT GCAGGTGGCC 
TCCGCCGACC AGTGCGTTTT CATCCTGGAC ATGGAGGCGT GGGAAGGGTG GACCTTTTCC 
GAGGAGCAGG TGCATCACTG GCTGGAGAAG TTCATGGAGG GGGGCGAGCC GCGCGTTCAC 
GAGCTCTTGA AGCACCTCGA TTTCGACCTG CTGCAGCTCT TCCTGAGCCG TGAGATCGAG 
GTCGGCGGAG GGATCGGCGA CCAGTCCAAC GACCAGGAAC GCCTCGCCGA GTACGATCAC 
ACCTTCGATG GCGTCTTCAT GATCAACTTC AAGAACCCCA AGCACAGCCA ATTGGTCGGT 
ACCTTCCTGT CCATGCTGAT CAAGCTGGAC AATTCCCTCT ACACGGCACT CATGGAAGGG 
GCCAAGGGGG AGGTGGACCT GGAGTTGGAG GAGCAGTGCC AGAGGTTCCG CACCGGCAGG 
CTTCAGGACC TGGGTTTCCC CCCGCTGGAC GAGGCGCTTT CGATCTACGC CCGGGTAAAC 
CCGGAGCATT TCCACCTGGA AGGGGGGAAG GAGTTGAGCC CGGCAGGGGA GGGGGGGCAA 
CTGGTACCCG TGGGCGCCGA CGAAGGGACC TTCTTTTCCC GCGCGCTCGC CCTCGCCGCG 
ACGCCGACGC TCTACCAGGA GCTGAACTAC CTGGTCAACA GCGCCCTGGT CGCGGAAGGA 
AACGCGTTCC ACGAGCCGGA AACGATGCTG GCCATTCTGC ACCGGGTGAG CGGCTATCTC 
AACATCGCGC TGGAGAGGCT GGCGCCGGCG GACGAGCAGC GGGCCGCGGA CATACTGGTA 
AGCGAGGAGT TGAAGAGGCT GTTCCAACTG GGGTACAGCA TCGTCTTGCA GTTGAAATTC 
AGCGCCCGCG ACGTCGAGAC GGCGGACTAC GCTTCCGGGA AGCTGCTGGC GGGGCTTAAG 
ACCAAACGCC CCCGGTTCTA CCGCGGGCTG GACCCGGACG GCGTCGACGG CTACCGCGAG 
TTCAGGGACC TTTCCGACGT CCAGCGCGTG GCGGACCTTT TGGCCCAGCT AAAACCCTGA

Protein sequence

MASVENRQVA AARLSQGDFQ ALPLDKKGKY LKTAPAREKM ELIIADPDAK RVAATLEPQE 
FFWLVKEVGE TDALELLQVA SADQCVFILD MEAWEGWTFS EEQVHHWLEK FMEGGEPRVH 
ELLKHLDFDL LQLFLSREIE VGGGIGDQSN DQERLAEYDH TFDGVFMINF KNPKHSQLVG 
TFLSMLIKLD NSLYTALMEG AKGEVDLELE EQCQRFRTGR LQDLGFPPLD EALSIYARVN 
PEHFHLEGGK ELSPAGEGGQ LVPVGADEGT FFSRALALAA TPTLYQELNY LVNSALVAEG 
NAFHEPETML AILHRVSGYL NIALERLAPA DEQRAADILV SEELKRLFQL GYSIVLQLKF 
SARDVETADY ASGKLLAGLK TKRPRFYRGL DPDGVDGYRE FRDLSDVQRV ADLLAQLKP