Gene GSU3047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3047
Symbol	flgI
ID	2686555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3350209
End bp	3351315
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	637127740
Product	flagellar basal body P-ring protein
Protein accession	NP_954089
Protein GI	39998138
COG category	[N] Cell motility
COG ID	[COG1706] Flagellar basal-body P-ring protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.805391
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC CCATGAAACG AATTTTTGTA GTCTTAGTCA TTCTTCTGGT GCTTCCCCAG 
TTGGCCCTGG CGATCAGGAT CAAGGATATC GCCAGTTTTG ACGGGGTACG GGACAACCAG 
CTCATCGGCT ACGGCCTCAT CGTGGGCCTG AACGGTACGG GCGACAGCGA CCAGACCAAG 
TTTCCGGTCC AGTCCCTGGC CAACGTGCTG GAGCGGATGG GCATCACCGT GAACCGCGAC 
GATATCAAGG TGAAGAACGT GGCCGCGGTC ATGGTGACCG CCGAGCTTCC CCCCTTCTCC 
AAGCAGGGGA CCAGAGTGGA CGTGCTCGTC TCATCCCTGG GAGACGCCAA GAGCCTTGCC 
GGCGGCACGC TGCTCATGAC CCCTCTCAAG GGAGCCGACG GCCAGGTCTA TGCCGTGGCC 
CAGGGAGGTC TGCTCACCAA CTCTTTCTCC TACGGCGGCC AGGCGGCAAC GGCCCAGAAA 
AATCACCCCA CGGCCGGCCG GATTCCCAAC GGAGCGCTGG TGGAGCGGGA GCTGCCCAAC 
GTCCTGGCGG ATCGGTCGCA ACTGCGGCTC AACCTGCACC AGCCGGATTT CACCACGGCC 
ACGCGCATCG CCCGGGCGGT CAACGAACAG TTCAAGGCCG GCGTAGCCAG CTGCAATGAT 
CCCGGTTCGG TCGTGATCTC CCTCCCCGAC GCCTATCAAG GACGGGTGGT TGAGTTTGTC 
GCCGATATGG AGCGCCTCGA GGTTCGCCCC GATAATCCGG CGAAGGTGGT CCTGAACGAA 
CGGACCGGCA CCATCGTCAT CGGCGAGAAC GTCCGCATCG ACACCGTTGC GGTCTCCCAT 
GGCAACCTGA CTCTCCTGAT CAAGGAAACG CCGAGGGTTT CCCAACCCCA GCCTCTGAGC 
CGCACGGGCG AGACCGTCGT AGTGCCTCGC ACCGGCATCA AGGTTTCCGA GGAGAGCGGC 
GGATTGGCCG TGTTGCGCGA AGGTGCCAGC ATCGGTGACG TGGTGCGCGC CCTCAATGCC 
CTGGGGGTGA CGCCGCGGGA CCTGATCGGC ATTCTCCAGG CAATCAAGGC TGCCGGGGCC 
ATGCAGGCAG AACTGTCGGT CATCTGA

Protein sequence

MDKPMKRIFV VLVILLVLPQ LALAIRIKDI ASFDGVRDNQ LIGYGLIVGL NGTGDSDQTK 
FPVQSLANVL ERMGITVNRD DIKVKNVAAV MVTAELPPFS KQGTRVDVLV SSLGDAKSLA 
GGTLLMTPLK GADGQVYAVA QGGLLTNSFS YGGQAATAQK NHPTAGRIPN GALVERELPN 
VLADRSQLRL NLHQPDFTTA TRIARAVNEQ FKAGVASCND PGSVVISLPD AYQGRVVEFV 
ADMERLEVRP DNPAKVVLNE RTGTIVIGEN VRIDTVAVSH GNLTLLIKET PRVSQPQPLS 
RTGETVVVPR TGIKVSEESG GLAVLREGAS IGDVVRALNA LGVTPRDLIG ILQAIKAAGA 
MQAELSVI