Gene TM1040_2225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2225
Symbol
ID	4078216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2336081
End bp	2337271
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	62%
IMG OID	638007547
Product	kynureninase
Protein accession	YP_614219
Protein GI	99082065
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3844] Kynureninase
TIGRFAM ID	[TIGR01814] kynureninase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.810346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACC TGCCCAAAAA ATACCTCTTC GATATTCCCG AGGGCATGAT CTATCTCGAT 
GGAAACTCGC TTGGCCCCCT GCCAAAGGGC GCGGCAGAGC GGGCCGCCAA GGTGCTGACC 
CAGGAATGGG GCACACAGTT GATCAAGGCC TGGAACACCG CCGACTGGAT GGCGCTGCCG 
CAAAAAGTGG GCGATCGTAT CGCGGGGTTC ATCGGCGCAG CACCGGGCAG CGTGGCCACG 
GGCGATACGC TTTCGATCAA GGTTTATCAG GCGCTCGCGG CGGCGCTCAA GATGCGCCCC 
GAGCGCCGGG TGATCCTGTC GGACACGGGC AATTTTCCGA CCGATCTCTA CATGGCGCAG 
GGGCTGATCT CCACCATCGG CAAGGACTAT GAACTGCGCA CCGTTGCCCC CGAAGAGGTC 
GCGGATGCGA TCACCGATGA TGTGGCGGTG GTGATGCTGA CGGAGGTGGA CTATCGCTCT 
GGCCGCCGTC ACGACATGAT GGAGATGACA GCACGCGCGC ATCAGAACGG CGCGGTGATG 
ATCTGGGACC TCGCCCATAG CGCAGGCGCG CTGCCGGTGG ATCTGACGGC CTGCAATGCA 
GAATTCGCGG TGGGCTGCAC CTACAAGTAT TTCAACGGGG GACCCGGTGC GCCTGCCTTT 
ATCTATGCGC GGCCCGACAT TGTGCTTGAG GTGGACCCTG CGCTTGCGGG CTGGCTTGGT 
CATGATGCGC CTTTTGCGAT GGAGCCCGAT TATCGTCCGG CGATGACCAC GGAGCGTCTG 
CGCGTTGGCA CGCCCTCGAT TGTGCAGCTC TCGATCCTTG ATACGGCACT GGATGTTTGG 
GACGGGGTCT CGATGGAAGA GATCCGCGGC GCGTCCGTGG CCCTGTGCGA GACGTTCATT 
GCCGAAGTCG AGGCCCGCTG CCCGGAACTG ACGCTTGCCT CCCCCAGAGA GGCAGCGCTG 
CGAGGGTCGC AGGTCTCCTT TGCCTTTGAG GATGGCTATG CGGTGGTACA GGCGTTGATT 
GATCGCGGCG TCATCGGCGA TTTCCGCGCG CCCAACATCA TGCGCTTTGG TTTCACACCG 
CTCTATCTCG ATCAGGCGGA TGTGGTGCAA GCCGCCGAGA TCCTTGAGGA TGTGATGAAG 
CGAGAGAGTT GGAAAGATCC CAAGTATCAG GTGCGCTCGC GCGTGACCTG A

Protein sequence

MTNLPKKYLF DIPEGMIYLD GNSLGPLPKG AAERAAKVLT QEWGTQLIKA WNTADWMALP 
QKVGDRIAGF IGAAPGSVAT GDTLSIKVYQ ALAAALKMRP ERRVILSDTG NFPTDLYMAQ 
GLISTIGKDY ELRTVAPEEV ADAITDDVAV VMLTEVDYRS GRRHDMMEMT ARAHQNGAVM 
IWDLAHSAGA LPVDLTACNA EFAVGCTYKY FNGGPGAPAF IYARPDIVLE VDPALAGWLG 
HDAPFAMEPD YRPAMTTERL RVGTPSIVQL SILDTALDVW DGVSMEEIRG ASVALCETFI 
AEVEARCPEL TLASPREAAL RGSQVSFAFE DGYAVVQALI DRGVIGDFRA PNIMRFGFTP 
LYLDQADVVQ AAEILEDVMK RESWKDPKYQ VRSRVT