Gene Daro_3294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3294
Symbol
ID	3567161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3544287
End bp	3545207
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	61%
IMG OID	637681767
Product	branched-chain amino acid aminotransferase
Protein accession	YP_286494
Protein GI	71908907
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01122] branched-chain amino acid aminotransferase, group I

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.845143
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGT CGGATCGCGA CGGCTTTATT TGGCAAGACG GCAAACTGGT GCCCTGGCGC 
GAAGCCACCA CCCACGTCCT CACGCACTCC CTGCACTACG GCATGGGTGT CTTCGAGGGT 
GTCCGTGCTT ACAAGACCGA ACGCGGCACG GCGATTTTCC GCCTCAAGGA GCACACCGAG 
CGCCTGTTCC GTTCGGCCCA TATCTTCCAG ATGCAAATGC CCTTCTCGGC GGAAGAGCTC 
AACGAAGCGC AGAAGGAAGT GATCCGCGCC AACAATCTCG AATCCGGCTA CCTGCGTCCG 
CTCGCCTTCT ACGGCTCGGA AAAGATGGGC GTTTCGCCCA AGGGCGCCAA GGTGCACGTC 
ATCATCGCTG CCTGGCCGTG GGGCGCCTAC CTCGGCGAAG AGGGCATGGA GCGCGGCATC 
CGTATCAAGA CGTCGTCCTA CACCCGCCAC CATGTGAACA TCACCATGGT GCGTGCCAAG 
GCCTCTGGCA ACTACATGAA TTCCATCCTC GCCAACAACG AGGCGACAGG TGACGGCTAC 
GACGAAGCCC TGCTCCTTGA TCCGGAAGGC TATGTCTGCG AAGGCGCCGG TGAAAACATC 
TTCATCGTCA AGAACGGCAA GCTGTACACG CCGGACCTGA CCGCCTGCCT CGAAGGCATC 
ACGCGCGCCA CGGTGATCCA GCTGGCCAGC GAAATGGGCG TCGAGGTCAT CGAAAAGCGC 
ATCACGCGCG ACGAAGTCTA TTGCGCTGAC GAAGCCTTCT TCACCGGCAC CGCCGCCGAA 
GTGACGCCGA TCCGCGAACT CGACAACCGC CAGATCGGTG TCGGCCATCG CGGCCCGATC 
ACCAAGGCGC TGCAGGAAAA GTATTTCGAC GTGGTCTATG GCCGCTCCGC TGCGCACGCC 
GACTGGCTGG CCACCGTCTA A

Protein sequence

MSMSDRDGFI WQDGKLVPWR EATTHVLTHS LHYGMGVFEG VRAYKTERGT AIFRLKEHTE 
RLFRSAHIFQ MQMPFSAEEL NEAQKEVIRA NNLESGYLRP LAFYGSEKMG VSPKGAKVHV 
IIAAWPWGAY LGEEGMERGI RIKTSSYTRH HVNITMVRAK ASGNYMNSIL ANNEATGDGY 
DEALLLDPEG YVCEGAGENI FIVKNGKLYT PDLTACLEGI TRATVIQLAS EMGVEVIEKR 
ITRDEVYCAD EAFFTGTAAE VTPIRELDNR QIGVGHRGPI TKALQEKYFD VVYGRSAAHA 
DWLATV