Gene TM1040_1402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1402
Symbol
ID	4075895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1495642
End bp	1496802
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	638006712
Product	lipid-A-disaccharide synthase
Protein accession	YP_613397
Protein GI	99081243
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0763] Lipid A disaccharide synthetase
TIGRFAM ID	[TIGR00215] lipid-A-disaccharide synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.873415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.256697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGCCTCA GGGTGTTTGT CCTTGCGGGG GAGCCTTCGG GTGACCGCCT TGGCGCGGCG 
CTCATGCGGG GCCTCAAAAC GCTCGCGCCC GACGTTTCCT TTGAAGGCGT CGGCGGCAGT 
CTGATGCAGA CCGAGGGGCT GAAGTCGCAA TTTCCCATGG AAGAGCTGTC CGTGATGGGG 
ATTGCCGAGG TCTTGCCGAA GTATTTCGAC CTCAAGCGCC GCATTCAGGA AACCGCCGAT 
GCGGTGGTGG CGATGAAGCC TGACGTAATG ATCACCATCG ACAGCCCTGA TTTTTCTCTG 
CGGGTGGCAA AGTTGGTGAA AGACGCCAGC GATATTCGAA CCGTTCATTA TGTTGCGCCC 
TCCGTCTGGG CGTGGCGGCC GGGGCGCGCG ACAAAGATGG CGAAGGTCAT CGATCATGTG 
CTGGCACTGT TGCCGTTCGA GCCGCCTTAT ATGGAAGCCG CCGGGATGGA GTGCGATTTT 
GTCGGCCATC CGGTTGTGGC TGAGCCCAAG GCGAGCGAGG CGGAAATTGC AACGTTTCGC 
GCGGCGTTTG ATCTGGGCGA TGCGCCCGTT CTCTTGGCGC TGCCGGGCTC GCGGCGGTCC 
GAGGTGGAGC GCCTTGCTGA TGTGTTCGGT GCAGCACTTG CACAGTTCAA AGCCAAACAC 
CCCGACCACC GGATCGTTGT CCCATCCGCA TCACATGTGG CGCCTATGGT GCGCGAGGCA 
CTGGCGAATT GGCCTGCGGA CAGCCTCGTG CTGGATCCGG CGGATCATGC GCCCGCAGTG 
TTTGCCGCGC ACAAGCGCGC AGCCTTTGCC ACTGCCGATC TGGCGCTGGC TGCGTCTGGG 
ACTGTCTCGC TCGAATTGGC CGCGGCGCGT ACACCGATGG TGATTGCCTA TCGGTTCAAC 
TGGCTCACCT GGCAGATCAT GAAGCGCATG GCGCTGATTG ATACGGTGAC ATTGGTCAAT 
CTGGTGAGCG ACACCCGCGT GGTGCCGGAA TGCCTTGGTC CCAATTGCAC CGCCGAAACC 
ATTGCGGCGC GTCTCGATCA GGTGTCGATG GCACCCGAGG CGCAGCAAGA TGCCATGCGC 
CTCACGATGG AACGGGTGGG GGAAGGCGGT GAAGCGCCGG GTCTACGTGC CGCCCGCGCA 
GTTCTCGCGC GGCTCCCATA A

Protein sequence

MGLRVFVLAG EPSGDRLGAA LMRGLKTLAP DVSFEGVGGS LMQTEGLKSQ FPMEELSVMG 
IAEVLPKYFD LKRRIQETAD AVVAMKPDVM ITIDSPDFSL RVAKLVKDAS DIRTVHYVAP 
SVWAWRPGRA TKMAKVIDHV LALLPFEPPY MEAAGMECDF VGHPVVAEPK ASEAEIATFR 
AAFDLGDAPV LLALPGSRRS EVERLADVFG AALAQFKAKH PDHRIVVPSA SHVAPMVREA 
LANWPADSLV LDPADHAPAV FAAHKRAAFA TADLALAASG TVSLELAAAR TPMVIAYRFN 
WLTWQIMKRM ALIDTVTLVN LVSDTRVVPE CLGPNCTAET IAARLDQVSM APEAQQDAMR 
LTMERVGEGG EAPGLRAARA VLARLP