Gene TM1040_0137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0137
Symbol
ID	4078742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	151103
End bp	152278
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	638005431
Product	histidine kinase
Protein accession	YP_612132
Protein GI	99079978
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00141334
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.983928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATGT CGATGCTCGA GAGTGAGGTC ACAGAGGCCT GGGCCGAACA ATACGAAACC 
GCTTTTGTGA CATATTGCAA CACCGGCTCC GAGGAGGCTT TGATCGAAGC ATATGCCTTT 
GCCCGGGAAG GTCTTGCTGC CAGCATGACC CTCGCAGTTT TTGCGTGTCT CCATCATGCA 
GCATTTTTCA AGCTTCTCGA GCAATCCGGT CCGGGGAACA ATCTTTATGA ACGCGCATTG 
GACTTTTATC TCGAAGGGGT CTCAGTGTTC GATATGGCCA TCCATGGGTA CCAAAACAAT 
GTTGCGCGCC TCAAAGAAGA AGTCACAGAG CGACGGCGCA TAGAGGAAGA TCTGCGCGCC 
GCCACCTTTG AGCTGTCTCG ACAACGCAGC GACCTCGACA TTCAAGTTCG CCAACGCACC 
GCAGAGTTGC GAGAGAGGGC GGAGGAGCTG GAGCAGTCCA ATCGCTTGCT CCTCCAGACC 
AACAAGGAGA CATCAGAGTT TTCCTACGCG CTGTCTCATG ACCTCAAATC TCCGATCAAC 
ACGATAGGCA TGCTTCTTGA TGCTATCCGA GAGGAACTGC CACCAGACAG CGAATCCGAA 
TGCGCAGACC TCGTATCGGA TGCATCGCTG ACAGCAGAGC GCATGAAGCG TCTGATCGAT 
GATGTATTGC AATACTCGCA AGTCGTTGGA AACACGCTTG AACGGGAATT GGTCGACATG 
AGCCAACTGT GCCAAGACGC CCTGTCTGAC ATGCGCCACG CGATCGACGA AGCACAAGCC 
GATATCTCAT GCTCCCATCT CCCGGTCGTG CGCGGAAGCG CGTTTCAACT GGCTATCATG 
CTGCGAAATT TCCTATCAAA CGCACTGACC TACCGCGATG CCTCTCGCCC CTTAAGGGTC 
GAGATCTCAG CGGGACCCAC CGCAGAGACT GGCCGGGTTT TGATTTCGAT TGCCGACAAC 
GGCATCGGCA TGCCACCAGA CTGCCATGCC CGGATTTTTA ACCTGTTCAC AAGGCTTCAC 
ACTTACAGCG ATTTTGAAGG ATCCGGCATT GGGTTAGCAT TATGTAAACG CGTGGCAAAT 
AATCATAACA GTGACATCGA AGTCGAATCC GTCGAGGGGC AAGGGACTAT ATTCAGCTTC 
TCTATCGAAA GCGAGGAGGT TGATACATGG CATTAA

Protein sequence

MTMSMLESEV TEAWAEQYET AFVTYCNTGS EEALIEAYAF AREGLAASMT LAVFACLHHA 
AFFKLLEQSG PGNNLYERAL DFYLEGVSVF DMAIHGYQNN VARLKEEVTE RRRIEEDLRA 
ATFELSRQRS DLDIQVRQRT AELRERAEEL EQSNRLLLQT NKETSEFSYA LSHDLKSPIN 
TIGMLLDAIR EELPPDSESE CADLVSDASL TAERMKRLID DVLQYSQVVG NTLERELVDM 
SQLCQDALSD MRHAIDEAQA DISCSHLPVV RGSAFQLAIM LRNFLSNALT YRDASRPLRV 
EISAGPTAET GRVLISIADN GIGMPPDCHA RIFNLFTRLH TYSDFEGSGI GLALCKRVAN 
NHNSDIEVES VEGQGTIFSF SIESEEVDTW H