Gene GSU0419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0419
Symbol	flgE
ID	2686295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	449476
End bp	450735
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	63%
IMG OID	637125084
Product	flagellar hook protein FlgE
Protein accession	NP_951478
Protein GI	39995527
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.809638
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTAA CATCCGCACT GTACACCGGC ATCAGCGGTC TCAACGCCAA CGGCGAGGCC 
ATGTCCGTCA TCGGCAACAA CATTTCCAAC GTCAACACCA TCGGCTTTAA GCAGGGCCGG 
ATGCTCTTCT CGGACGTCCT CTCCAGCACC ATCAGCGGCG GGTCCCAGAT CGGCCGCGGC 
GTCCAGATCC AGACAGTGGA GAATCAGTTC ACCCAGGGCT CCTTCGAGAG CACCGAGAGC 
GGTACCGACC TGGCCATCCA GGGCGATTCC TTCTTCGTGG TCCAGAACAC CAGCGGCCGC 
TACTATACCC GCGCCGGCGC CTTCTCCTTC AATAAGGACA AGACCCTGGT GAATCCGGAG 
GGATATCAGG TCATGGGGTA CGGCATCATT CCCTCGTCGG GACTTTCCGA CGGCGTGCTC 
AAGCCCATCG ATCTGACCAA CTTTGCCACC ACTCCGCCGA AGCAGACTTC CACCGTCAAG 
TTCGTGGTGA ACCTGGACTC CACCCAGACC ACGCCGACCC TGGCGTGGGA CCCCGCAAAC 
CCGGTTGCCA CGTCCAACTA CTCGACCAGC CTGTCGGTCT ACGATTCCCA GGGCAATGCC 
CACACCGCCA CGGTGTATTT CCGCAAGACC GCCGACAACG CATGGGACTG GCACGTCATC 
CTCCCCGATG CCGCGGCAGG CACGCCGGGC AGCACCACTA CCCCCATCGA CGGGACCCTC 
ACCTTCGATG CCACCGGAGC CCTCACCGCC CAGACTCCCC TGGCCGGCGC GGCCCAGAAC 
ATCACCTTCG CGGGCGGCGT CACCGCACCC CAGCCGATCT TCTTCGACCT GGGAGTCGGC 
GCTACCACCC AGTACGCCAG CTCGTCGGTG GTTTCTTCCC AGACCCAGGA CGGCTACTAC 
CAGGGCACCC TCACCAAGGT AACCATCGAT GACAAGGGAT ACGTGAACGG CGTGTACTCC 
AACGGCCAGC TTCAGAAGCT CTACCAGGTG GCCCTGGCCA AGTTCTCCTC CACGGCCGGC 
CTGTCCAAGG CGGGTGGCAC CCTCTTCGAG GAGACCCTCG AGTCGGGACA GCCCCTGTTC 
TCCGACGCCA GCACCCCCGG CGTCGGCAAG ATCCTCGCCA ACTCCCTGGA GCAGTCCAAC 
GTTGACATGG CGGCCCAGTT CGTCAAAATG ATCACCACCC AGCGTGGCTA CTCCGCCAAC 
TCCAAGACGA TCACCACGGC CGACGAGATG CTGCAGGAAG TGCTCAGTCT CAAGCGGTAA

Protein sequence

MSVTSALYTG ISGLNANGEA MSVIGNNISN VNTIGFKQGR MLFSDVLSST ISGGSQIGRG 
VQIQTVENQF TQGSFESTES GTDLAIQGDS FFVVQNTSGR YYTRAGAFSF NKDKTLVNPE 
GYQVMGYGII PSSGLSDGVL KPIDLTNFAT TPPKQTSTVK FVVNLDSTQT TPTLAWDPAN 
PVATSNYSTS LSVYDSQGNA HTATVYFRKT ADNAWDWHVI LPDAAAGTPG STTTPIDGTL 
TFDATGALTA QTPLAGAAQN ITFAGGVTAP QPIFFDLGVG ATTQYASSSV VSSQTQDGYY 
QGTLTKVTID DKGYVNGVYS NGQLQKLYQV ALAKFSSTAG LSKAGGTLFE ETLESGQPLF 
SDASTPGVGK ILANSLEQSN VDMAAQFVKM ITTQRGYSAN SKTITTADEM LQEVLSLKR