Gene TM1040_3692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3692
Symbol
ID	4075661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	753091
End bp	754230
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	638005212
Product	hypothetical protein
Protein accession	YP_611921
Protein GI	99078663
COG category	[R] General function prediction only
COG ID	[COG4671] Predicted glycosyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.833754
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTTC TGATTGCTGT GACGCATCTC TTGGGCACCG GGCATCTGTC GCGCGCCCTC 
ACATTGGGGC GGGCGTTTTC GCGACTGGGC CATGCCGTTA CCGTGATCTC TGGCGGGTTT 
CCAGCGCCGC AACTCAGCCT TGAGAGCGTC CAGATCGAGC AATTGCCACC GCTGCGCTCT 
GATGGGGTGG CGTTCACGCG CCTGCTGGGC GAAGGGGGCG AGGTCGCGGA TGAGGCCTAT 
CTTGCCCGCA GGGTGCATCA GCTGGAAACC GTGGTTCAGG CTCGGGAACC CGATGTTCTG 
ATCACGGAGC TTTACCCCTT TGGTCGCCGC GCTCTTAGGG CAGAGTTCCG CGCCCTCCTT 
GAGGCTGCCA AGGCCCTGCC CCGCCCGCCC CTGATCCTGT CCTCGATCCG TGATATTCTT 
GCCCCGCCGT CAAAGCCGCA AAAGGCCGTG GACGCCGATG CAATGATTGA GCGCTATTAC 
GATGGCGTGC TCGTTCACTC CGACCCCAAG GCGACCCGGC TCGAGGTCAG CTGGCCTGTC 
TCGGACATGC TCGCCGCCAA GCTGCATTAC ACCGGCTATG TCGCCCCACC AGCCGCAGCG 
CCGCATCCCG ATGGGGTTGG CAAAGGCGAA ATCCTCGTCA GCGCTGGCGG TGGCAGCGTC 
GGAGATGCAC TATATGCCTG CGCCATTGAG GCCGCCAAGG AGATGCCAGA CTATAGCTGG 
CGCATTCTTG TCGGCGGCGC GGATGCGGCG GCGCGGATCG CAGAGTTGCA CGACCCAAGT 
TCGCCCGCGA GTCTTGAGCC TGCCCGCTCT GACTTTCGCG CGATGCTGCC CCATGCCGCC 
GCCTCCGTGA GCATGTGTGG CTACAATACC GCACTGGATT TGCTGCAATC GGGTACCCCA 
GCGGTGCTCG TGCCCTTTGA TGCGGGCAAG GAGGTGGAGC AGACCCTGCG CGCCAAGAGC 
CTGTCTCCGT TACCAGGTTT TGAGGTCGAA GCGGCGGCGA CACTCACGCC AGCCCGTCTC 
GCGACAGCGC TGCGCCGCGT TATGCAGGAT ACGCAACGCA GCCTTGACGG CTTTGAATTT 
GACGGAGCGG GTCAGAGTGT GGAGATTGCC GCAACGCTGC TGAGGGGGCA GCGCGCTTGA

Protein sequence

MKVLIAVTHL LGTGHLSRAL TLGRAFSRLG HAVTVISGGF PAPQLSLESV QIEQLPPLRS 
DGVAFTRLLG EGGEVADEAY LARRVHQLET VVQAREPDVL ITELYPFGRR ALRAEFRALL 
EAAKALPRPP LILSSIRDIL APPSKPQKAV DADAMIERYY DGVLVHSDPK ATRLEVSWPV 
SDMLAAKLHY TGYVAPPAAA PHPDGVGKGE ILVSAGGGSV GDALYACAIE AAKEMPDYSW 
RILVGGADAA ARIAELHDPS SPASLEPARS DFRAMLPHAA ASVSMCGYNT ALDLLQSGTP 
AVLVPFDAGK EVEQTLRAKS LSPLPGFEVE AAATLTPARL ATALRRVMQD TQRSLDGFEF 
DGAGQSVEIA ATLLRGQRA