Gene TM1040_1532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1532
Symbol
ID	4075830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1636457
End bp	1637821
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	63%
IMG OID	638006845
Product	hypothetical protein
Protein accession	YP_613527
Protein GI	99081373
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.340629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGG ATATTTTTGG ACAAGAGTGC AGCCTCACCG ATCCCCGCGC ACTCGCGGAA 
TGGAACGGCG CGCAGACCGG CGTTCTTGCC CATGCGGCGC GCACCGCTGG CCACCTTGGG 
GCGGTGTTGG ACGCCGCGCC CGATTTTGCC CTCGGTCAGG CCATCAAGGG GCTGTCGCTG 
TTGATGCTTG GGCGCTCCGA ACTCTTGCCG ACCGCGCGCG AGGCGCTGGC TATTGCCAAG 
TCGACCTATG AAGGCGCGTT GCCGCGAGAA CGCAAATATG TCGACGCATT GGAAGCCTGG 
CTCTCGGGTC ATCCCTCGCG CGCGATCACC TGCATGGAAG ACATCCTGAC CCGGCATCCC 
TGCGACACGC TGGCGATGAA ACTCAGCCAT GGGATCCGCT TTATCATGGG CGACGCCCGC 
GGCATGCGCG CCTCTATCGA GCGTGTGCTG CCCGCCTATT CGACCGAGCA CGCAGGACAT 
GGCTATCTGT TGGGCTGTCA CGCCTTTGCC CTCGAGGAAA CCGGCGACTT CGACCGGGCG 
GAAATCACCG GACGTCAGGC ACTTTGGACC GCGCCGGACG ATGCATGGGG GCTGCATGCG 
GTGGCACATG TGCATGACAT GACCGGAAAT GCCAGGACTG GATTGGGTTG GCTTGAGGGC 
CGCGAAGAGG CCTGGGCGCA TTGCAACAAT TTTCGCTACC ATGTGTGGTG GCACAAGGCC 
CTGATGCACC TCGACCTCGG CCAAATCGAC GAGGTGATGC GGCTCTATGA TGATGAGGTG 
CGCAAGGACA AGACCGACGA CTACCGCGAC ATCTCCAATG CCACCTCGCT GCTGATGCGG 
CTCGAACTTG ATGGGGTCAA TGTCGGAGAC CGCTGGGACG AGCTGGCAGA GCTTTGCGAA 
AACCGAACTG AGGACGGCAG CCTCATCTTT GCCGATCTGC ATTACCTGCT GGCGCTGATC 
GGCGGCGATC GCGCAACGGC CACAGGCCAG CTGATCCGGC GGATCCATGC CGATGGAACC 
CAGCCCAAGA CCGAAGCCGC GCAAAGAATG GCCGACCCGG GCTGCGCGGT GTCAAAGGGA 
CTTGAGGCTT TTGGGGAAGG CCACTACGGC ACAGCCTTCG ACTACCTCGC TAAGTCACGG 
GATTCGTTGC AACTTGCAGG TGGCAGCCAT GCCCAGCGGG ACGTGTTTGA ACGCATGACC 
ATCGACGCTG GGCTGCGCTC GGGGAACTGG GCACAAGTGG AGGCCATTTT GGATGACAGA 
CGTGCCAAAC GCGGAGGGGG CGAAGACAAT TATGCGATGG CCCGTCGCGC CTTGATTGCG 
GCCGCCCAAA GCGAGGGCGG CGCACAGAGC GTCCCGGCGG AGTGA

Protein sequence

MTQDIFGQEC SLTDPRALAE WNGAQTGVLA HAARTAGHLG AVLDAAPDFA LGQAIKGLSL 
LMLGRSELLP TAREALAIAK STYEGALPRE RKYVDALEAW LSGHPSRAIT CMEDILTRHP 
CDTLAMKLSH GIRFIMGDAR GMRASIERVL PAYSTEHAGH GYLLGCHAFA LEETGDFDRA 
EITGRQALWT APDDAWGLHA VAHVHDMTGN ARTGLGWLEG REEAWAHCNN FRYHVWWHKA 
LMHLDLGQID EVMRLYDDEV RKDKTDDYRD ISNATSLLMR LELDGVNVGD RWDELAELCE 
NRTEDGSLIF ADLHYLLALI GGDRATATGQ LIRRIHADGT QPKTEAAQRM ADPGCAVSKG 
LEAFGEGHYG TAFDYLAKSR DSLQLAGGSH AQRDVFERMT IDAGLRSGNW AQVEAILDDR 
RAKRGGGEDN YAMARRALIA AAQSEGGAQS VPAE