Gene GM21_0419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0419
Symbol
ID	8135728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	492371
End bp	493501
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	61%
IMG OID	644868037
Product	zinc finger SWIM domain protein
Protein accession	YP_003020257
Protein GI	253699068
COG category	[S] Function unknown
COG ID	[COG4279] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGTT TTTACGAATG GTATCCCCCT TACGTTTCCG TGGCGGAGAG GCGCGCCAAT 
GCGAAAGCCG AGATGGAGAA GTTGCGCAAG AAGAAGGGGG TGAACGTCCA GCCGGTGGAG 
ATCTCCGGGC GCACCATCGC CTCATCCTTC TGGGGTAAGG GGTGGTGCGA TCATATAGAG 
TCCTTCCACG ACTACGCCAA CCGCCTGCCG CGCGGACGCT CCTACGTGAG AAACGGCTCG 
GTCTGCCACC TGGAAATAAA GCCGGGAAGC ATCGAGGCGC TGGTGAGCGG TTCGATGCTT 
TACAACGTCG CCATCACCAT CGCCCCGATC TCGCAGGCTA AATGGAACGC CGTCAAGGCC 
GCCTGCGCGG GCCAGATAGG CTCCCTCATC GACCTGTTGC GCGGCAGACT CGCCAGCGGC 
GTCATGGAAG TGGTGTCCCA TCGGAGCACC GGCCTCTTTC CACTGCACAA AGAGATCCGC 
TTCAGCTGCG ATTGCCCCGA TTCCGCCAAG ATGTGCAAGC ACATAGCAGC CGTTCTTTAC 
GGAGTGGGGG CGCGTCTGGA TCACGCGCCG GAGAAGCTTT TCCATCTGAG AGGCGTGAAC 
CACGAAGAGA TGGTGGACGT GGCGAGCACG ATAGGTGTGG CGACCGGTGC GGGGAGTTCC 
CGGCGCCGGT TGGCAGCGAC AAGTCTGGAC GACATCTTCG GCATCGACCT GGCGGGGGGC 
GGATCGGAGA GCGCAGACGC GGCAGAGGCC AAGGATGCGC CGATTCCGAA GGCGAAAAAA 
CCCGTGGCGG CCCGTCCTGC CACCGCAAAA AAAGAAGCGA AGACAGAGGC GCAAAAAGCG 
ACACAGATGG GAGCGGCGCT ACCGGTTAAG GAGGTAAAAG TACGCGCGAA GGTAGTAGTT 
GAGACACCTC TTGTGGCGCC CACCACGTCG ACACCGTTTC CAAGACGTCT CACCGGGAAA 
GTAATCCTTA CCTGGCGCAG TTCCCTGCGA GAGACCCAGG CGGAGTTCGC CTCACGGATC 
GGCGTTTCCG CCGGATGTAT CTCGCAGTGG GAGAAAAAGC TGAGACAGAC CCTTCAGGTG 
AGGGAGCGCG CGTTGGCTGC GCTGCAAAAG GCATGGGTCG ACACTCATTA G

Protein sequence

MSRFYEWYPP YVSVAERRAN AKAEMEKLRK KKGVNVQPVE ISGRTIASSF WGKGWCDHIE 
SFHDYANRLP RGRSYVRNGS VCHLEIKPGS IEALVSGSML YNVAITIAPI SQAKWNAVKA 
ACAGQIGSLI DLLRGRLASG VMEVVSHRST GLFPLHKEIR FSCDCPDSAK MCKHIAAVLY 
GVGARLDHAP EKLFHLRGVN HEEMVDVAST IGVATGAGSS RRRLAATSLD DIFGIDLAGG 
GSESADAAEA KDAPIPKAKK PVAARPATAK KEAKTEAQKA TQMGAALPVK EVKVRAKVVV 
ETPLVAPTTS TPFPRRLTGK VILTWRSSLR ETQAEFASRI GVSAGCISQW EKKLRQTLQV 
RERALAALQK AWVDTH