Gene TM1040_1442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1442
Symbol
ID	4078072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1540223
End bp	1541452
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	60%
IMG OID	638006753
Product	aminotransferase, class V
Protein accession	YP_613437
Protein GI	99081283
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.259917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.109823
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCG CCATGGATAT CGAATTTGTC CGCAAACAAT TTCCGGCATT TGAACAGCCC 
TCTTTGCAGG GTCAGGCCTT CTTTGAGAAT GCAGGCGGCT CTTACACCTG CCGGCAGGTG 
ATCGACCGCC TGTTTCGATT TTACACCGAG CATAAGGTCC AGCCCTACGC GCCTTATGCC 
GCCTCCGAGG CAGCCGGCGC CGAGATGGAT GAAGCGCGCA GTCGTCTGGC GGCGATGCTG 
GGTGTCTCTG CGCAGGATCT GAGCTTCGGT CCTTCGACAA CCCAGAATAC CTATGTGCTG 
GCGCAGGCCT TCCGGGGCTT CTTGAAGCCG GGCGAGAAGA TCATCGTTAC CAATCAGGAC 
CATGAGGCCA ACTCCGGCCC GTGGCGACGC TTGGCCGACG AGGGCATCGA GGTGCTGGAG 
TGGCAGATCG ATCCTGCCAC CGGCCATCTT GAACCGAGCG CGCTGGAGGA TCTCTTGGAC 
GAGAGCGTGC GGCTGGTCTG TTTTCCCCAT TGCTCCAATG TGGTGGGCGA GATCAATCCG 
GTCACGGAAA TCACTGCGCT GGCCCATGCT GCGGGGGCTT TTGTCTGCGT TGATGGCGTC 
TCTTACGCGC CGCATGGTTT GCCGAACGTG GGTGAACTGG GGCCGGATAT CTATTTGTTC 
TCCGCCTATA AAACCTATGG CCCTCATCAA GGGATCATGG TGATCAATCC CGCTCTTGCC 
GAGCTTTTGC CCAATCAGGC GCACTACTTT AACGGGGATG TTCCTTACAA ACGCTTCACC 
CCCGCCGGAC CCGATCACGC GCAGGTCGCC GCCTGTGCGG GAATGGTCGA CTACTTCGAG 
GCGCTCGCCG AACATCACAA CGCACCTGAG ATCACAGGCA CAGGGGCGGG CGCCTTTGTG 
CACGATCTGA TGCGCGAGCA GGAGATCTCC TTGTTGCAGC CGCTCCTGGA TGCGGTGAAG 
GGGCGAAACG ATGTGCGCTT GCTTGGCCCC GCGAACGCCA AAGAGCGTGC CCCGACCGTC 
GCGCTTGCGC TTGGGCGGGC AGCAGAGCCC GTTGCCAAGC AATTGGCAGA GCTTGGGATC 
ATGGCGGGGG GCAGCGACTT TTACGCAGTG CGTGCGCTCA GGGCAATGGG GGTCGACCCC 
GCGCAGGGCG TGCTGCGGCT GAGTTTTACT CACTATACCG ATCAATTGGA GGTGACAGCG 
CTGATCGAGG CCCTAGATCG CGTCCTGTAA

Protein sequence

MKRAMDIEFV RKQFPAFEQP SLQGQAFFEN AGGSYTCRQV IDRLFRFYTE HKVQPYAPYA 
ASEAAGAEMD EARSRLAAML GVSAQDLSFG PSTTQNTYVL AQAFRGFLKP GEKIIVTNQD 
HEANSGPWRR LADEGIEVLE WQIDPATGHL EPSALEDLLD ESVRLVCFPH CSNVVGEINP 
VTEITALAHA AGAFVCVDGV SYAPHGLPNV GELGPDIYLF SAYKTYGPHQ GIMVINPALA 
ELLPNQAHYF NGDVPYKRFT PAGPDHAQVA ACAGMVDYFE ALAEHHNAPE ITGTGAGAFV 
HDLMREQEIS LLQPLLDAVK GRNDVRLLGP ANAKERAPTV ALALGRAAEP VAKQLAELGI 
MAGGSDFYAV RALRAMGVDP AQGVLRLSFT HYTDQLEVTA LIEALDRVL