Gene TM1040_3771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3771
Symbol
ID	4074943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	-
Start bp	15000
End bp	16031
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	62%
IMG OID	638004430
Product	hypothetical protein
Protein accession	YP_611166
Protein GI	99077907
COG category	[S] Function unknown
COG ID	[COG5397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.0472674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGC TAGGCATGAT TTCTCTCAGC AGTATCGCAA TGAGCGCCTA TACCGATCTG 
GTGCGCCTCC TGAAGGATGA GGCCTTGTCC GGTGTTGAAG GCAAGCCAAC GCTCAAAGAG 
CGCGGCGACA AGGCCTATTG GTACGCCGTG CGCCGCGTCG GAACGGAGAT GCGGTTCCTC 
TATATCGGCG AGGACAGTGA CGAGACACGT GCACGTATCG GACGGATCGA GGAACTGCGC 
GGGGCGGCCA AGGAACGTCA GGCAGAACGG TCTCGGCTCG TTCGACTTCT GCGCGCCGAA 
GGCATGACAC CCACCGACCG GTCGACCGGG TCCATCCTGT CGGCCATGGC CGCAGCGGGG 
ACATTCCGGT TGGGTGGCAC CATCGTCGGG ACGAATGCCT TCCGGCTCTA TGAGGGCGAG 
CTGGGTGTTC GTTTGCCTTT GGCGGGCATG GCCAATACAG CCGACATCGA TATCGCCCAG 
TTCGAAAAAC TGAGCGTGGC GTTGCAAGAT CAGGTCGACC CGGGCCTGGC CGAGACCTTC 
TCGGCACTCA AATTTGATCC CTTACCGGCT CTTGACCAAG GCCGGAGCTG GCGATGGGCC 
CAGGGCGGCA GTGGCCAGTT GGTCGAGTTC CTGACACCTG CGTTCGGGGA TGAGAGCGTC 
CGTGATCTGC CAGCATTGGG TGTGAGCGCG CAAGGATTGA ACTATCTCAA TTTTCTGATT 
GCCGAGCCGA TCCATGCGGC GGCGATCTAT CGGTCCGGCG TTCTGGTCCA GGTGCCGCGC 
CCGGAACGTT ACGCGATCCA CAAGCTGATC ATTGCCGATC GGCGTCGTGA CGGGGCAGGG 
AGCCTCAAAT CGGCGAAGGA CAGGGAGCAG GCTGCTTTCC TGATCGAGGC GATGGCCGAG 
GACCGTCCCG ATGATCTGTT GCAGGCTTAC GCCACGGCCA TGGAAGTCGG GCCGCGCTGG 
CGGGAGCATA TTGGGAACTC GTTGACGCGA ATGCCTGAGA CCAAGGGGAC GCTCGACAGC 
TTGGGCGCGT GA

Protein sequence

MKLLGMISLS SIAMSAYTDL VRLLKDEALS GVEGKPTLKE RGDKAYWYAV RRVGTEMRFL 
YIGEDSDETR ARIGRIEELR GAAKERQAER SRLVRLLRAE GMTPTDRSTG SILSAMAAAG 
TFRLGGTIVG TNAFRLYEGE LGVRLPLAGM ANTADIDIAQ FEKLSVALQD QVDPGLAETF 
SALKFDPLPA LDQGRSWRWA QGGSGQLVEF LTPAFGDESV RDLPALGVSA QGLNYLNFLI 
AEPIHAAAIY RSGVLVQVPR PERYAIHKLI IADRRRDGAG SLKSAKDREQ AAFLIEAMAE 
DRPDDLLQAY ATAMEVGPRW REHIGNSLTR MPETKGTLDS LGA