Gene TM1040_3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3854
Symbol
ID	4074917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	-
Start bp	106169
End bp	107140
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	65%
IMG OID	638004511
Product	KpsF/GutQ family protein
Protein accession	YP_611246
Protein GI	99077987
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCGC GAGAACTGAC CTGTGATGAA ACCCTTGCCG AAATGGCCCG CGTGCTGACC 
GTGGAGGCCG CCGCGCTGAC TCAGATGGCT TCTGAGGTGG GCGATCCACA GCTCAAGGCG 
GTCGAGATTC TCGAGGCCAT GGAAGGCCGT GTGATCGTGT CGGGCGTCGG CAAATCCGGC 
CATATCGGCA ATAAGATCGC CGCCACCCTG GCCTCGACGG GGACGCCTGC GCAATTTGTG 
CATGCCACCG AGGCGAGCCA CGGCGATCTT GGCATGGTGA CGCCGCGCGA TGTCTGTCTG 
GTGATCTCCA ATTCCGGCGA AACCTCCGAG CTGGCCGATA TCGTCACCTA TAGCCGCCGC 
TTTGCTATTC CGCTCATTGC CATCACCCGC AAGGCCGACA GCACCCTCGC GACCCAGGCC 
GATGTGGTGC TGCTGCTGCC CGATGCGCCC GAGGCCTGCG GCATCGGCAT GGCCCCCACC 
ACCTCGACCA CGGCAACGCT GGCGATGGGG GATGCGCTGG CGGTGGCCCT GATGAAACGG 
CGCGGCTTTG AGCGCGAGGA TTTCAAGGTC TTCCACCCCG GCGGCAAGCT CGGCGCGCAG 
CTGATGCTGG TGGATGGGCT GATGCACACG GGCGAGGCGC TGCCGCTGGT GGCGCCAGAG 
ACACCGATGA CAGAGGCGCT TTTGATCATG ACCGCCAAGG GCTTTGGCCT TGCGGGGCTG 
GTCGAAGGTG GCCGCCTCAC GGGCATCATC ACCGACGGCG ATTTGCGCCG CAATATGGAT 
GGTCTGATGG CGCGCAGCGC CGGCGAGGTG GCCACCCGCG GCCCCAAGGT GATCCGGCGC 
GGTTCGCTGG CCTCCGAGGC GCTCCACGAC ATGAACAGCC GCAAGATCTC GGCGCTGTTT 
GTGCTCGATA ATGAGGACCG GGTGGCGGGC TTGCTGCATA TCCATGACTG CCTGCGGGCT 
GGGTTGGCTT GA

Protein sequence

MTPRELTCDE TLAEMARVLT VEAAALTQMA SEVGDPQLKA VEILEAMEGR VIVSGVGKSG 
HIGNKIAATL ASTGTPAQFV HATEASHGDL GMVTPRDVCL VISNSGETSE LADIVTYSRR 
FAIPLIAITR KADSTLATQA DVVLLLPDAP EACGIGMAPT TSTTATLAMG DALAVALMKR 
RGFEREDFKV FHPGGKLGAQ LMLVDGLMHT GEALPLVAPE TPMTEALLIM TAKGFGLAGL 
VEGGRLTGII TDGDLRRNMD GLMARSAGEV ATRGPKVIRR GSLASEALHD MNSRKISALF 
VLDNEDRVAG LLHIHDCLRA GLA