Gene TM1040_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0076
Symbol
ID	4075973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	78842
End bp	79999
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID	638005363
Product	lipopolysaccharide biosynthesis protein-like
Protein accession	YP_612071
Protein GI	99079917
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3754] Lipopolysaccharide biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.39731
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTGC CTCTATGGAA GATCAAACGC GAGCTGAAGC GTCAAGGCAG GCAGCTAAAG 
AACATTGGGC CTCGTCTTGC GAGCCTTTTG TTTTCGCGGA CCTATTATGA TCTATTCCTT 
TCTGGAAAGA AGACCGTCAC CGAAGGTCAG ATCCCCAAGC GTCCAAAGGT CGCGGTCTAC 
CTGATCTTTC CAAGCTCCGG CATTCTCGGG TCTCATATCG AGGCGCTGCG GTATCTTGCA 
CAGAACGGAT ACGCGCCCGT CGTGGTCTCA AACCTGCCCC TTGATGAGGG CGACCTTGAA 
CACCTGCGCG CTCATGCGCA TCTCGTCATC CAGCGTCCGA ACTATGGCTA TGATTTTGGC 
GGCTACCGCG ATGGTGTTCT TGAGGTCGCC GCGCGTCACA CAAGCGTGGA GCGTTTTGTC 
CTGCTCAACG ATTCTGCCTG GTTCCCCTTG CCTGGGTCGC GCAATTGGCT GGCCGATGCC 
GAAGCGCTGG AGCTGGATTT CGCGGGTGCG GCGACGAACT ATGGCCACAC GCGGGTCGAT 
CCGAAGAATT TCCGGGACAT CCGCTGGCAC TATTCCAGCA ATCACCGCAA CTTTCACTAC 
TGCTCCTTCG CTTTGATGAT GAGCGGGAAG CTGTTCAACG ATAAGCGGTT TCAGCGCTTC 
TGGAAGAGCT TTCCGCTCAC CAATGACAAG ACCGTCACGG TAAGGCGGGG CGAGATTGGC 
CTCACGAAAT GGGTCATCCA GCAAGGTTTC TCGCATGGCT CTACGCTCGA TATTGCCGCG 
CTTGATCAAA GGCTGGCTGA ATATGGCATA GATGAGCTGC GCGCGATTGC CGCGCAGACC 
CTGATGCCGC AGAGCCCCTC GATGAAAGAG GTCCTGGAAG ACACCGTCCG CTCGGCAGAG 
AGCAAAGAAG ATTTGGTCAA CGTGATCCTG ACTGCGATCG CGAGGAAAGG CATCAGCTAT 
GCGCAACCTC GTCTGATCCA CCGTGACTAC GGGTTCGCGT TCCTCAAGAA ATCGCCGCTT 
TGGCTGGATG AGGATGCCTC AAACCTGACC CTCGCCTTCA CCCGCGACCT TGATGGAGAA 
TTTGGCAAAG TCCTGCAGGC TGAGGCATTG GACCTGCGCC GGACAAGAGC GGCGGAATTT 
GCACCCGCCC CGGACTGA

Protein sequence

MSLPLWKIKR ELKRQGRQLK NIGPRLASLL FSRTYYDLFL SGKKTVTEGQ IPKRPKVAVY 
LIFPSSGILG SHIEALRYLA QNGYAPVVVS NLPLDEGDLE HLRAHAHLVI QRPNYGYDFG 
GYRDGVLEVA ARHTSVERFV LLNDSAWFPL PGSRNWLADA EALELDFAGA ATNYGHTRVD 
PKNFRDIRWH YSSNHRNFHY CSFALMMSGK LFNDKRFQRF WKSFPLTNDK TVTVRRGEIG 
LTKWVIQQGF SHGSTLDIAA LDQRLAEYGI DELRAIAAQT LMPQSPSMKE VLEDTVRSAE 
SKEDLVNVIL TAIARKGISY AQPRLIHRDY GFAFLKKSPL WLDEDASNLT LAFTRDLDGE 
FGKVLQAEAL DLRRTRAAEF APAPD