Gene GM21_3141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3141
Symbol
ID	8138492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3645061
End bp	3646212
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	644870745
Product	hypothetical protein
Protein accession	YP_003022926
Protein GI	253701737
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	153
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACTT CCTACGTCAC CATCATGCTG GTGGTCTTTC TCGTGCTGAC CGGTCTCGCC 
ATAGACATCG GTTACATGTA TGTAAGCGAC GAGGACCTGC AGCATTCCGC GGAAATGGCG 
GCCCTGACCG GAGCCGAGTC GCTCAAAAAG CGGCTGCTCT TGCAGGCGCA GCACTCCCCG 
GGAAAGCTGG CGCAGGTCTT AGCGGACCCT CTGCAGTCGG CGGCACGCAG CGTCGCCGTG 
GACACCGCGA CCGGAAAACA CAGCGCCTCG GCACTCGTCG CCCTCATGAA CGACAACGGC 
AACGCCCTCA CTGAAAACAA CGACATAACG GTCGGCTTTT GGAACATGAG TAGCCGCAGT 
TACACCCCGG GGGGGACCCC GGTGAACGCG ATGCAGGTGC GGGCGCGGCG AACGGCGGAA 
AGCAGCTCCG TGGGCCTTGG CAGCCTCGGC ACTTTCGTCG CCAAGATAAG CGGTACCGCC 
TCCTTCGGCT CCACGCCGGT GGCGGTGGCG GCCCTGGTTC CCGGCACCCG CTCCAACATC 
GCCATCTGCG CCGCCGCCTG CGAGCCCTCC TGCGGCTATC CCGATGTCTG CAGCATACCG 
GAACGAAGGA TGAGCCACCT GCCCTGGGAT CCCCAGAGGG AAAATTCCAG CGCCAACCGC 
TACCTCTACA CCTCGCTTTT GCACCCGGTC ACCATCACCA ACACCATGAG CGACCTCGTC 
TGCCAGGAGA TGCCGGTGCA GGAAGTCTGC GGCCTCCCCA TCTTCACCGC CGCCATGAAG 
ACAGACGCCA TCCTGCGCGA CCTTAAGGCG ATGATGTACG ACCCGAACGT GGACAGCTCC 
AACAAGGAGT ACGACAACAA CGGGAAACTC GCGGGATGGT GGGTGGTGGT CCCCGCCACC 
GACTGCGCCG GCTTCCAGGC GGGAGAGGCC TTCGAGCAGC ACACGGTGGT GAAGTACTCG 
CTGGTGCGCA TCAGCAGGAT CTGCGCCGCT GGGGAGCCCG GCTGCGGCAA GGCCTCGGCC 
AGCGCCGATC AGCCGGCAGT CGCCTGCGTC CCCGGCGGGG AAGGGCTTTA CATCGACCGC 
ATCTCCTGCG TCGGCTGCGA CAACGCCTCG AAGAGGCAAT TCTTCGGGCT GCGCCCCGTC 
CTGGTCAACT AG

Protein sequence

MDTSYVTIML VVFLVLTGLA IDIGYMYVSD EDLQHSAEMA ALTGAESLKK RLLLQAQHSP 
GKLAQVLADP LQSAARSVAV DTATGKHSAS ALVALMNDNG NALTENNDIT VGFWNMSSRS 
YTPGGTPVNA MQVRARRTAE SSSVGLGSLG TFVAKISGTA SFGSTPVAVA ALVPGTRSNI 
AICAAACEPS CGYPDVCSIP ERRMSHLPWD PQRENSSANR YLYTSLLHPV TITNTMSDLV 
CQEMPVQEVC GLPIFTAAMK TDAILRDLKA MMYDPNVDSS NKEYDNNGKL AGWWVVVPAT 
DCAGFQAGEA FEQHTVVKYS LVRISRICAA GEPGCGKASA SADQPAVACV PGGEGLYIDR 
ISCVGCDNAS KRQFFGLRPV LVN