Gene TM1040_2475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2475
Symbol
ID	4076840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2614208
End bp	2615395
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	60%
IMG OID	638007799
Product	hypothetical protein
Protein accession	YP_614469
Protein GI	99082315
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.407377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0590595
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGG CGCAAATCGA AATCCAGGTG TTGAGCAGCC TGTCGCAGAT CGCGGCATCG 
GACTGGGACG CCTGTGCCTG CCCAGAGGCT GAGGCCGGCG GGCGACCGCT TGATCCCTTT 
ACCACGCACC GGTTCCTGAG CGCGCTCGAA GACAGCGGCT CGGTAGGGCA GGGGACCGGC 
TGGCAGCCGC AGTACCTTAC CTGCTATCTC GATGGGCAAC TGGTCGCCTG CGCGCCGCTC 
TATGCCAAGG GGCACAGTCA GGGCGAATAT ATTTTCGATC ACAATTGGGC GCATGCCTAT 
GAGCGAGCGG GTGGGCGCTA CTACCCAAAG CTGCAGGTCG CGGTGCCGTT TACCCCGGCC 
ACCGGACGCA GATTTCTTGT GCGTCCAGGC TATGAAGAAA TCGGCATCTC CGCCTTGCTT 
CAGGGCGCGG TACAATTGGC GTCTGACAAT CAGCTGTCCT CTCTTCATGT GACATTCTGC 
ACCTCCGACG AGGCTGAGGC CGGGCGCGAA ATCGGCCTGA TGTCACGCAG CTCTCAGCAG 
TTTCACTGGC TCAATGACGG CTACGCGGGG TTCGAGGCGT TCTTGGCGGC GCTCTCATCT 
CGCAAGCGCA AGAACATCCG CAAGGAACGC AAACAGGCCC AGGGGTTTGG CGGCAGTATC 
GAAACCTACA CCGGCGCAGA CCTGCGTTCC GAGCATTGGG ATGCTTTCTG GCGGTTCTAT 
CAGGATACTG GCAGCCGAAA ATGGGGCACG CCCTATCTGA CGCGTGCGTT TTTCGAAATC 
ATCCATGACA CAATGGCCGA GGACATGGCG TTGGTCTTGG CTGAGCGGGA CGGCGTGCCG 
GTCGCGGGTG CGCTGAACTT TATCGGGGCC AAGACGTTGT ATGGCCGGTA CTGGGGGTGC 
ATGGAACATC ACCCCTGCCT GCACTTTGAG CTGTGCTACT ATCAGGCGAT CGATCTTGCC 
ATCGAGATGG GACTGGATCG GGTCGAGGCT GGCGCGCAGG GCGAGCACAA ACTGGCGCGT 
GGCTATTTGC CAACCGAGAC CCACAGCCTG CATTGGGTCG CAGATCCGGG GTTTCGTGCA 
GCTATCGAAC AATATCTGGA GGCAGAACGG GCTGCCGTAG GAGAAGAGAT CGAGATCCTC 
ACCTCCTATG GGCCGTTCAA GAAGACCCAT GTGGAGGAAC AGGAATGA

Protein sequence

MDQAQIEIQV LSSLSQIAAS DWDACACPEA EAGGRPLDPF TTHRFLSALE DSGSVGQGTG 
WQPQYLTCYL DGQLVACAPL YAKGHSQGEY IFDHNWAHAY ERAGGRYYPK LQVAVPFTPA 
TGRRFLVRPG YEEIGISALL QGAVQLASDN QLSSLHVTFC TSDEAEAGRE IGLMSRSSQQ 
FHWLNDGYAG FEAFLAALSS RKRKNIRKER KQAQGFGGSI ETYTGADLRS EHWDAFWRFY 
QDTGSRKWGT PYLTRAFFEI IHDTMAEDMA LVLAERDGVP VAGALNFIGA KTLYGRYWGC 
MEHHPCLHFE LCYYQAIDLA IEMGLDRVEA GAQGEHKLAR GYLPTETHSL HWVADPGFRA 
AIEQYLEAER AAVGEEIEIL TSYGPFKKTH VEEQE