Gene TM1040_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2939
Symbol
ID	4077090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	3108809
End bp	3110077
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	58%
IMG OID	638008268
Product	hypothetical protein
Protein accession	YP_614933
Protein GI	99082779
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.490439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTT CCTCCTCGCT GAATGCTGGA GTAGCAGGGC TCGCCGCGAA TTCAACTCGT 
TTGGCAGCCA TTTCCGATAA CATCGCGAAC TCCTCGACAG CCGGCTACAA GCGTGTTGTG 
ACCTCATTTG AATCCATGGT CATTTCCCAA TCCGGCGGCC GCTACGCAGC AGGTGGCGTC 
TCCGTCAACA ACACGCGCAT GATTGACGAG CGCAGCTCCC TGATCTCCAC CAGCAACGCC 
ACCGATCTCG CCGTTGCAGG CCGTGGCTTC CTCCCGGTCG CAAGCTTGGC CGAAGTGAAG 
GCAGGTGAAG ATCCGAACAT GCTTCTGACC ACCTCCGGCT CCTTCCGCAC CAATGACGAA 
GGGTATCTGA CAACAAGCTC CGGTCTGGTG CTGCTGGGTT GGCCCGCGAA TTCCGATGGA 
ACACTCCCCA GCGTCGCGCG CGACACGGAT GATCCGCTCG AGCCCATCAG ATTTGATACT 
GCACAGCTGA GTGCGGCCCC GACCACTGCA GTGAGCCTGG GTGTAAACCT GCCTGCAAGC 
AGCGCTGTGA CAGGTGCCGC TGGGGCGGCT GAAGAAAACA CCATCCAATA TTTTGACAAC 
CTCGGCGGTC AACAGGATCT GAACATCGTC TACACCCCAA CCGGGGCTGC GGACAACGAG 
TGGACCATGA CCCTCACCGA TGGTGTCACA GGCACCGTGG TTGGGGACTA CACGTTGACG 
TTTGACGACT CCGTGACGGG CAAAGGGACG CTCTCTACCG TCACGACCAC AACCGGTGGC 
GCCTATGATC CTGCGACTGG CGCCATAATA GTCACCACTG ATAGCGGTCC AATAGAGATT 
GAAATCGGCG TGATGACGCA GCTTGCCAGC TCTTTCTCTG CCGCGACCAT CGAAAAAGAT 
GGCTATGAAG CGGCAAGCTT TGCGGGTGTT GAAGTGGACG AGGGTGGCTA TGTGCATGCG 
CTCTATGAAA ACGGCAGCAG TCGCATCGTT TACCAGATCC CGCTTGCGGA TATGCCAAAT 
GCCAATGGGA TGCGGTCTCT GGACAGCCAG ACCTTCATGC CCTCCCCTGA CAGTGGTGCG 
TACTACCTCT GGGATGCGGG CGCCGGGCCG ACTGGAACAG TGGCCAGCTA CCGTCAGGAG 
GAATCCGGCA CCGATGTTGC TTCTGAATTG ACCACGATGA TCCAGACCCA GCGGGCCTAT 
TCGTCGAACG CAAAGGTCAT TCAGACTGTG GATGAGATGC TTCAGGAAAC GACCAACATT 
AAGCGCTGA

Protein sequence

MTISSSLNAG VAGLAANSTR LAAISDNIAN SSTAGYKRVV TSFESMVISQ SGGRYAAGGV 
SVNNTRMIDE RSSLISTSNA TDLAVAGRGF LPVASLAEVK AGEDPNMLLT TSGSFRTNDE 
GYLTTSSGLV LLGWPANSDG TLPSVARDTD DPLEPIRFDT AQLSAAPTTA VSLGVNLPAS 
SAVTGAAGAA EENTIQYFDN LGGQQDLNIV YTPTGAADNE WTMTLTDGVT GTVVGDYTLT 
FDDSVTGKGT LSTVTTTTGG AYDPATGAII VTTDSGPIEI EIGVMTQLAS SFSAATIEKD 
GYEAASFAGV EVDEGGYVHA LYENGSSRIV YQIPLADMPN ANGMRSLDSQ TFMPSPDSGA 
YYLWDAGAGP TGTVASYRQE ESGTDVASEL TTMIQTQRAY SSNAKVIQTV DEMLQETTNI 
KR