Gene Daro_1949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1949
Symbol
ID	3567878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2101581
End bp	2102738
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	637680420
Product	aminotransferase, class V
Protein accession	YP_285165
Protein GI	71907578
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.00000781244
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.177382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCGCC CCGTCTATCT CGACTACAAC GCCACGACGC CGCTCGATCC TGCGGTGCTG 
GCAGCAATGT TGCCCTGGCT GGAAAGCCAG TACGGCAACG CCTCGAGTCG TCACGAATAT 
GGCCGGCAGG CACGGCAGGC GATTGATGAG GCGCGACAGA GAGTTGCAGC GGCGGTCAAT 
GCGCACCCGA CGGAAGTGAT TTTTACCAGC GGTGGCAGCG AAGCCAATAA CCTCTTTCTG 
AAGGGCGCTG CGGCCAGTCT CAAACCGGGC ACGTTGGCCG TAAGTGCCAT CGAGCATCCC 
TGTGTGCTCA AACCGGCCGC CCAGTTGGTA AAGCAGGGTT GGCAGGTCAA ACATATCGCA 
GTCGATAGCG CCGGAAGGGT GAGTGCGGCG GATTACGCCG AAGCCATGCA GGCCAAACCA 
AAGCTGGTGT CGGTGATGCT TGCCAATAAC GAAACCGGTG TCGTGCAGGA TGTCGCTGTG 
CTGGCAAACT CGGCAAAGAG CGCTGGCGGC TGGTTTCATA CCGATGCCGT CCAGGCCTTG 
GGGAAGCTGG ATATCGACTT TCGCGCCCTC AACATGGCCG GCGTGCATGC CATGACGCTA 
TCTGCCCACA AGGCCTACGG CCCGAAAGGT GCAGCAGCGC TGGTTCTCGA CAAGCGTGTC 
GAATTGCAGC CGCTGATTGC CGGTGGTGGC CATGAGCGAG GCTTGCGTTC CGGCACTGAA 
AACGTGCCGT CGATTGTCGG ATTTGGCGTT GCTGCGGAAC TTGCAGCGAA TCGTGTTGCC 
GAACTGTCGG CTCGCTTGCG AGTCATGCAG GCGAAGCTGG AAGCCGGGCT GGTTGCATTG 
GGTGCCCGGG TCTTTGCGAC AGATGCGATG CGTTTGCCGA ACACCAGCTA TTTCGCCTTT 
CCGGATATCG ATGGCGAAAC GCTGGTCGGC AAGCTGGACC GCGAAGGGTT TGCTGTGGCT 
AGCGGCGCGG CATGTTCCAG CGCCAATCCG GAGCCATCGC ATGTTCTGCG GGCAATGGGT 
GTGGCGCCGG AAATCGCCCG TGGGGCAATA CGTGTCAGCC TCGGGGCAAG TAACACTGAA 
GTTGAAATTG AACAATTCAT CAACGCCTTG CAGGCTACAG TCGGACGCCT GCAGGGACTG 
ACGGCGATGG CTGTCTGA

Protein sequence

MFRPVYLDYN ATTPLDPAVL AAMLPWLESQ YGNASSRHEY GRQARQAIDE ARQRVAAAVN 
AHPTEVIFTS GGSEANNLFL KGAAASLKPG TLAVSAIEHP CVLKPAAQLV KQGWQVKHIA 
VDSAGRVSAA DYAEAMQAKP KLVSVMLANN ETGVVQDVAV LANSAKSAGG WFHTDAVQAL 
GKLDIDFRAL NMAGVHAMTL SAHKAYGPKG AAALVLDKRV ELQPLIAGGG HERGLRSGTE 
NVPSIVGFGV AAELAANRVA ELSARLRVMQ AKLEAGLVAL GARVFATDAM RLPNTSYFAF 
PDIDGETLVG KLDREGFAVA SGAACSSANP EPSHVLRAMG VAPEIARGAI RVSLGASNTE 
VEIEQFINAL QATVGRLQGL TAMAV