Gene TM1040_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2103
Symbol
ID	4077854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2208354
End bp	2209778
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	64%
IMG OID	638007422
Product	aminotransferase, class V
Protein accession	YP_614097
Protein GI	99081943
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTTTG ATGAGTTCAA AACGTCGATC AAAAACACAG CGGACGCGGG GCAACTGGCC 
GCGACATTGA TTGGCGAAGG GGTCATGATC CCCGGCCTCA GAGGTGATGT GCCGCTGGTC 
TATGCAGACT ATGTGGCCTC TGGGCGCGCG ATGCGCCCAG TCGAAGACTT CATTGCCGAA 
AAGCTCCTGC CGTTTTATGC CAACTCGCAC ACCGAAGCGT CCTATTGCGG GCAGTATGTG 
ACCCGGATGC GGCGTGAGGC GCGGGCAGAA ATCGCGCGGC TGACGGGTGC GGGGGACGAC 
TGCGAGGTGA TCTTTGCAGG CTCCGGTGCC ACGGCGGGTT TGAACCGGTT GGTGAAGCTT 
TTGGGGATTG AAGAGGCCAC GCGCCCGGTT GTGTTTATCG GCCCCTATGA GCATCACTCC 
AACATCCTGC CGTGGCGCGA GAGCCGCGCC GAGGTGGTCG AAATCCCCGA AGGCCCTGAT 
GGCGGCGTGG ATCTCGCAGC CCTCGAGGCG GCCTTGGTTG CGCATGCGGA GGCGGATCTG 
AAGATCGGCA GCTTCTCGGC GGCGTCGAAC GTGACGGGGA TCATCACCGA TCCCGACCCG 
GTCACGCGGC TGTTGCGCGC GCATGGCGCA CTTGCGGTTT GGGACTATGC CGGGGGTGGG 
CCCTATCTGC CCATCGACAT GGGCGCGCAT GGCGCCGAGC CTAAGGACGC TGTTGTGGTT 
TCGCCGCACA AATTTCCGGG CGGGCCGGGG GCCTCTGGCG TTCTGGTGCT GCGCCGCGAT 
GCGGTGCGGG CGCAAAACCC CTCATGGCCA GGGGGGGGCA CGGTGAGCTT TGTCTCGCCT 
TGGTCGCATC GCTACGCTGA CAGTCTCAGC GCGCGAGAGG AAGCCGGCAC GCCCAATGTG 
GTGGGTGACA TTCGTGCGGC GCTGGCGTTT TTGGTCAAGG AAGCCGTGGG GCAGGAGCAG 
ATCGAGGCCC GCGAGGCGCA GTACGCTGCA AAGGCGCGCG CGGCCTGGGC GGATGTGCCG 
GGGCTGACGC TTCTGGGGCA CGCGCATGCC CACCGGCTGC CGATCTTTTC CTTTACCGTG 
GAAGGGGCCT CCGGTGCGCC GGTGCATCAG CAACTCTTCA CCCGCATGCT CAGCGATGTT 
TATGGCATTC AGGCGCGTGG TGGATGCGCC TGCGCGGGAC CTTATGCACA CCGGCTGCTT 
GAGATCGACG AGCCTCAGTC TGAGGCCCTG CTTAGGGATC TTCTTGCCGG ACGGGAGCTG 
CAGAAACCGG GCTGGGTGCG GTTGAACTTC TCTTACCTGA TGGCCGAAGA GACCGTGGAT 
TATGTGATCG AGAGCGTGAA GGCGCTGGTG CTGGAGGCCG AAAATGTCGC CTCTGCTTAT 
GATGCGGATC CGAGCACCGC GCGCTTTCAG CCACGGGCAG CCTGA

Protein sequence

MIFDEFKTSI KNTADAGQLA ATLIGEGVMI PGLRGDVPLV YADYVASGRA MRPVEDFIAE 
KLLPFYANSH TEASYCGQYV TRMRREARAE IARLTGAGDD CEVIFAGSGA TAGLNRLVKL 
LGIEEATRPV VFIGPYEHHS NILPWRESRA EVVEIPEGPD GGVDLAALEA ALVAHAEADL 
KIGSFSAASN VTGIITDPDP VTRLLRAHGA LAVWDYAGGG PYLPIDMGAH GAEPKDAVVV 
SPHKFPGGPG ASGVLVLRRD AVRAQNPSWP GGGTVSFVSP WSHRYADSLS AREEAGTPNV 
VGDIRAALAF LVKEAVGQEQ IEAREAQYAA KARAAWADVP GLTLLGHAHA HRLPIFSFTV 
EGASGAPVHQ QLFTRMLSDV YGIQARGGCA CAGPYAHRLL EIDEPQSEAL LRDLLAGREL 
QKPGWVRLNF SYLMAEETVD YVIESVKALV LEAENVASAY DADPSTARFQ PRAA