Gene GM21_3109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3109
Symbol
ID	8138459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3605163
End bp	3606230
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	65%
IMG OID	644870713
Product	NHL repeat containing protein
Protein accession	YP_003022895
Protein GI	253701706
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	150
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCT GCTTCCTTTT CCGCTCGCGC TACCTCGTCC ATGCGGCGGC GTTTTTGGCG 
GCGTTGCTCC TTCTGGCCGC GCCGGGTTGC GCCGTCAACG AGGCGGCCCG GATCCCGCAG 
CCCGTCGACA AGGTGGTCTG GCCCCCCCCG CCCCTCGAAC CCCGCGTGGC CTGGGTGCAG 
CTGATCCGGA ACTCGAACGA CTCTGGCATC GAAAAAGGAT TTTTCTCAAG GGTATCCGAC 
CTTTTGTTCG GCGAGGAGGT CCTGCGGGTG AGCCGCCCTT ACGGCATCCA CGTGGACAAG 
AAAAAGAGGG TCATCTTCGT CAACACCGGC ACGGGGAGCG TCCATGTCAT CGACCGCGGC 
GCCGGTCGTT ACGGCGTGGT GACCGGCCCC GAGGGTGAGC CATTCCTCTC CCCGATAGCG 
GTGACCGAGG ACCCCGACGA GACCGTCTAC GTGACCGACT CCGCGGCGGC GAAGGTTTAC 
CGTTTCAACG CCTCGGACCT GAAGGTGGAG CCCTTCATAA CCACCGGTTT GCAAAGGCCT 
ACCGGCATCG CCTACAACCC GGCGACCGAT CTGATCTACG TCACCGACAC CGTGGCCGGG 
CAGGTCGTCG CCTTCACCAG AAAGGGGAAG GAGGCGTTCC GGTTCGGCTC CCCCGGCAGC 
AAGCCGGGCC AGTTCAACCA CCCGACGGAC ATAGCCGTGG ACGCCAAGGG GGGGATCGCG 
GTCACCGATC CTTTGAACGG CCGGATCCAG ATCTTCTCCG GCAAGGGGGC GTTCCTCGCC 
GCCTTCGGCC GGATGGGGAA CACCTCGGGA AGCTTCGCCA AGCCCAAGGG GGTGGCGGTC 
GACAGCAGCG GTAACCTGCA CGTCTGCGAC GCCCTGTTCG ACACGGTCCA GGTGTTCAAC 
CCGCGGGGGG AGCTCCTGCT CAATTACGGG ATCAGGGGGG GGGAGAGGGG GGAATTCTGG 
ATGCCCTCCG GCCTCTACAT AGACGGCGAA GACGCCATCT ACGTGGCGGA CACCTACAAC 
GACAGGATCC AGGTGTTCCA GTACCTGAGG GACGTGACCG AGAACTAG

Protein sequence

MDRCFLFRSR YLVHAAAFLA ALLLLAAPGC AVNEAARIPQ PVDKVVWPPP PLEPRVAWVQ 
LIRNSNDSGI EKGFFSRVSD LLFGEEVLRV SRPYGIHVDK KKRVIFVNTG TGSVHVIDRG 
AGRYGVVTGP EGEPFLSPIA VTEDPDETVY VTDSAAAKVY RFNASDLKVE PFITTGLQRP 
TGIAYNPATD LIYVTDTVAG QVVAFTRKGK EAFRFGSPGS KPGQFNHPTD IAVDAKGGIA 
VTDPLNGRIQ IFSGKGAFLA AFGRMGNTSG SFAKPKGVAV DSSGNLHVCD ALFDTVQVFN 
PRGELLLNYG IRGGERGEFW MPSGLYIDGE DAIYVADTYN DRIQVFQYLR DVTEN