Gene GM21_4081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4081
Symbol
ID	8139455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4661097
End bp	4662326
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	58%
IMG OID	644871696
Product	ErfK/YbiS/YcfS/YnhG family protein
Protein accession	YP_003023854
Protein GI	253702665
COG category	[S] Function unknown
COG ID	[COG1376] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	137
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAGGG CTCCCGAGCA ATCGTTGCAA CCGCCCGTTC CCATGCAAAA TGAGATCGAG 
CGGAACGTCT TTTCGGTAGC CGACGGTGAT GACGTCATCG GCACCTTGGC GGTGGTGAGG 
CTTGATAACG GCGACACCCT GCCGGACATC GCCAGGCACT TCGGCCTTGG GATCAACGCA 
ATCAGTGCCG CCAACCCGGG TGTCGATGTC TGGGTCCCCG AACCGGGAAA GGAGATCATC 
CTCCCTTTGA GTTTCATCCT GCCGGATGCT CCCCGTAAAG GCATCGTGAT CAACTTGGCC 
ACCATGCGGC TTTTCCGCTT CAAGGAGGAT AGTAAAGGGC AAGTGGTGTC GACCTACCCT 
GTCGGTGTCG GCACAGCGGA ACGGCCGACG CCTACAGGCA AAATGCGGGT GGAACGCAAG 
ACTGCCCTGC CCACCTGGTA CGTACCCGCT TCAATTGCCG AGGATCATAA GAAAAAGGGA 
GATCTTCTGC CCGCGAAGGT TCCGCCAGGA CCTGAAAACC CCTTGGGTGA GCGCGCGCTG 
TATCTGAGCA AGGCGGGATA CCTGATTCAT GGCACCAACA AGCCGGCCAG CATAGGTCTT 
AAGGCGACCA ACGGCTGCCT GCGGCTCTAC CCCGAGAATG TGATGACGCT TTACGAGGAG 
ACGCCGGTCA ATACCCCTGT GCTCATTGTG AGCCAGCCGT ATCTAGTGGG GGAACGAGAC 
GGCGTGGTTT ATCTTGAGGC TCATGCCCCT CTGGAGAACT CGGGTGCTCA GGAGTTGGAG 
AAGGTGACGG CAAAACTGAG GAAGTTGGAA AAGAAGTACG GACGCAATCT TGACTGGAAA 
AAAATCGGAA AAGTACAGGC CGAGGCCAGA GGTGTTCCTG TCCCCATAAT GGTCTTTGGT 
GCAGGCAACG CCAAAGATAG TGTGAAGACC GTTAACGTCG AACGGCCGCT ACGAATCTTC 
GGCGCACCCG AGGTACCGGA GCTGCGACTG GACGCCTGGT ATGTTCTCGC TGCCAATGTC 
GGGCATGAGA TCGAGGCCCG GAGGCTAGCG GCCATCATCA ACCACCAGGG CCCGCCTATC 
CCGGCACGGG TGCTGCCGCA AGGGAGCAAT AGCTACCATG TCATCGCAGG CCCTTTCGAT 
AATGTCGGCG TGGCCAAAGA AGCGGTCAGG CGACTGAAGC TCGACCTGGA GCTCAACGGC 
ATACTGATTG ACCCGGTCAA GAAGATATAG

Protein sequence

MQRAPEQSLQ PPVPMQNEIE RNVFSVADGD DVIGTLAVVR LDNGDTLPDI ARHFGLGINA 
ISAANPGVDV WVPEPGKEII LPLSFILPDA PRKGIVINLA TMRLFRFKED SKGQVVSTYP 
VGVGTAERPT PTGKMRVERK TALPTWYVPA SIAEDHKKKG DLLPAKVPPG PENPLGERAL 
YLSKAGYLIH GTNKPASIGL KATNGCLRLY PENVMTLYEE TPVNTPVLIV SQPYLVGERD 
GVVYLEAHAP LENSGAQELE KVTAKLRKLE KKYGRNLDWK KIGKVQAEAR GVPVPIMVFG 
AGNAKDSVKT VNVERPLRIF GAPEVPELRL DAWYVLAANV GHEIEARRLA AIINHQGPPI 
PARVLPQGSN SYHVIAGPFD NVGVAKEAVR RLKLDLELNG ILIDPVKKI