Gene GM21_0320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0320
Symbol
ID	8135627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	394729
End bp	396051
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	63%
IMG OID	644867937
Product	protein of unknown function DUF195
Protein accession	YP_003020159
Protein GI	253698970
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	118
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCCTG ACCTTTTTCA ATTGATCATC CTGCTATCTT GCACCGCCAC CTTCGTGGTC 
GCGTTCCTTT GCTACCTGCA TCTCAAACGG GCGCACATTG CCGAAGCGCG CTTCGACCAA 
CTGGAAAAGG GGCTGGAGCG ATTGGAGCGC ACCCTCCAGA CGGAACTGGG GCGAAACCGC 
GAGGAGCTGG GGGGGAACCT CAGGCAGTTC GGGGAGGCGG TGCAAAAGCG GATGGTGGAT 
ATCGCCTCGC TGCAAAAGGG ACAGCTGGAA GGGTTCACAC AGCAGCTCGG CAGCCTCACC 
GCGAGCAACG AGCAGCGCCT GGATAAGCTG CGCGAAACGG TAGAGCTGCG CCTCAAATGG 
CTGCAGGACG ACAACTCGAA AAAGCTGGAG CAGATGCGCG CCACGGTCGA CGAAAAGCTG 
CACGAGACCC TGGAGAAGCG GCTGGGCGAG TCGTTCAAGC AGGTAAGCGG CCAACTGGAG 
CAGGTCCACA AGGGGCTGGG GGAGATGCAG TCGCTTGCCG CAGGCGTCGG CGATCTGAAA 
AAGGTCCTCT CCAACATCAA GACCCGCGGC ACGCTCGGCG AGGTGCAGCT GCACAACCTT 
TTGGAGCAGA TACTCACCCC GGACCAGTAC GGCGCCAACG TCGCCACGAA GCCTGGGAGC 
GACGCGCGGG TCGAATTCGC CATTCGCCTC CCCGGCAAGG ACGACAAGCC GCTCTGGCTC 
CCGGTCGACG CCAAGTTCCC GCAGGAGGAC TACCTGCGGC TGGTCGAGGC CCAGGAGCAG 
GGGAACCAGG TCGCGATACA GGAGGCGACC AGGCAGTTCG ACAAGACCGT CGCCGCCATG 
GCCAAGCTCA TCTGCGAGAA GTACTTGGCC CCTCCCGACA CCACCGATTT CGCCGTGATG 
TTCCTGGCCA ACGAGGCAAG CTACGCGCAG GTGTTAAGCC GTCCCGGGCT CTTCGACGCC 
ATCTTGCGCG AGCACAAGGT CATCGTCGCA GGCCCCACCA CCATCGCCGC GCTGCTTTCG 
TCGCTCAGCC TCGGCTTCAA GACGCTCACC ATCGAGAAGC GCAGCAGCGA CGTCTGGCGG 
CTATTGGGCG CGATAAAGAC CGAGTTCATG ACCTTTGGGA CCCTGCTGGA AAAAACCAGG 
AAAAAGTTGG ACGAGGCCTC CTCCAGCATC GACACCGCCG CCACCCGCAC CCGCCGTATT 
CAGCGCAAGA TGCAGGGGAT CGAACAGTTG CCGGAGCACG AGGCGAAGGG ATTGCTGGGA 
GGGGAGCTTG GCGCGGCCCC CGAGCCGGAG AGCGGCGAGG TGATCCTGAT CGACGAGGCG 
TGA

Protein sequence

MRPDLFQLII LLSCTATFVV AFLCYLHLKR AHIAEARFDQ LEKGLERLER TLQTELGRNR 
EELGGNLRQF GEAVQKRMVD IASLQKGQLE GFTQQLGSLT ASNEQRLDKL RETVELRLKW 
LQDDNSKKLE QMRATVDEKL HETLEKRLGE SFKQVSGQLE QVHKGLGEMQ SLAAGVGDLK 
KVLSNIKTRG TLGEVQLHNL LEQILTPDQY GANVATKPGS DARVEFAIRL PGKDDKPLWL 
PVDAKFPQED YLRLVEAQEQ GNQVAIQEAT RQFDKTVAAM AKLICEKYLA PPDTTDFAVM 
FLANEASYAQ VLSRPGLFDA ILREHKVIVA GPTTIAALLS SLSLGFKTLT IEKRSSDVWR 
LLGAIKTEFM TFGTLLEKTR KKLDEASSSI DTAATRTRRI QRKMQGIEQL PEHEAKGLLG 
GELGAAPEPE SGEVILIDEA