Gene TM1040_2500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2500
Symbol
ID	4076502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2641580
End bp	2642899
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	60%
IMG OID	638007824
Product	protein of unknown function DUF224, cysteine-rich region
Protein accession	YP_614494
Protein GI	99082340
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.908613
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACGA GTTTCACCGA CGCGCAATTG CAGGACCCCG GTACGCAGCG GGCCAACGAG 
ATCCTGCGCA CCTGTGTGCA CTGTGGTTTT TGTACGGCGA CCTGTCCGAC CTATCAAGTG 
CTCGGGGACG AGTTGGACAG CCCGAGAGGC CGGATTTACC TCATCAAGGA TATGCTCGAG 
AACGAGCGCG TGCCGGATGA GAAAACCGTA AAGCATATCG ACAGATGCCT GTCGTGCCTT 
GCTTGTATGA CCACTTGTCC ATCGGGCGTG CATTACATGC ATCTTGTGGA TCACGCGCGT 
GCCTATATCG ACAAGCATTA CAAACGCCCC TTTGGTGATC GGGCACTGCG GTGGATCCTG 
GCGCGCATCC TGCCCTATCC CACGCGGTTT CGCCTCGCGC TGTTGGGAGC AAAGATTGCG 
CGTCCCTTCC GGGGACTGAT GCCTGACCCA AGGCTGCGGG CGATGCTGGA GATGGCGCCA 
AAGGTCATCC CCCCGGTGAG CCGCAATGAC GACCCGCAGA GTTTTGCGCC GGAAGGGCGG 
CAAGTGAAAC GCGTGGCGCT TATGACGGGC TGCGCGCAAA AGGCGCTCAA TACGGATATC 
AATGACGCCA CCATCCGGCT CCTTCGGCGT TTGGGGTGCG AGGTGGTTGT GGCGGACGGG 
GCCGGCTGTT GCGGGGCTCT GACGCATCAC ATGGGGCGTG AGGACGAAAG CCACGCAACC 
GCCGCCAAGA ACATCCGCGC GTGGATGGCA GAGAAGAACG GCAAGGGCCT TGATGCGATT 
GTCATCAACA CATCGGGCTG TGGTACCACG GTCAAGGACT ACGGCCACAT GTTCCGCAAT 
GATGCGCTGG CACAGGATGC GGCAACTGTG TCGAACCTGG CGATGGATAT CTCCGAGTTG 
CTGATGCAGC TTGAAATGCC AGAGGCTGAG GATAAGGGGC TGACGGTCGC CTATCACGCC 
GCCTGTTCGC TGCAGCATGG CCAACAGATC AAGACGCATC CCAAGACGCT GCTGAAACGC 
GCGGGCTTTC GAGTGGTTGA ACCAGCCGAC AGCCATCTGT GCTGCGGCTC TGCAGGGACC 
TATAATCTGC TGCAGCCGGA GATTTCCGCA CAACTAAAGG CACGCAAGCT GCGCACGCTT 
GAGGCGAAAA ATCCCGACAT CATCTCTGCG GGGAACATCG GGTGCATGAT GCAAATCGGA 
TCTGGCACCG AGATCCCGAT CGTGCACACT GTGGAGCTCT TGGACTGGGC AACCGGAGGC 
CCTCAGCCAC CCGCTCTCAC GGCGGAGCGC AGCCGACCCT CAGTTCCCAT CTTGCGCTGA

Protein sequence

MQTSFTDAQL QDPGTQRANE ILRTCVHCGF CTATCPTYQV LGDELDSPRG RIYLIKDMLE 
NERVPDEKTV KHIDRCLSCL ACMTTCPSGV HYMHLVDHAR AYIDKHYKRP FGDRALRWIL 
ARILPYPTRF RLALLGAKIA RPFRGLMPDP RLRAMLEMAP KVIPPVSRND DPQSFAPEGR 
QVKRVALMTG CAQKALNTDI NDATIRLLRR LGCEVVVADG AGCCGALTHH MGREDESHAT 
AAKNIRAWMA EKNGKGLDAI VINTSGCGTT VKDYGHMFRN DALAQDAATV SNLAMDISEL 
LMQLEMPEAE DKGLTVAYHA ACSLQHGQQI KTHPKTLLKR AGFRVVEPAD SHLCCGSAGT 
YNLLQPEISA QLKARKLRTL EAKNPDIISA GNIGCMMQIG SGTEIPIVHT VELLDWATGG 
PQPPALTAER SRPSVPILR