Gene Saro_0446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0446
Symbol
ID	3918314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	489185
End bp	490354
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	68%
IMG OID	640443175
Product	aminotransferase
Protein accession	YP_495728
Protein GI	87198471
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.317433
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAGC TCTCCCGGGC GCTTGCGCGC ATCGCTCCTT CCCGTACCAC CGCTATCACC 
GACCGCGCGA TCCAGCTTCG CGCCGAAGGC CGCGACGTGA TCTCGCTCTC GGTGGGCGAG 
CCTGATTTCG CCACGCCCGC GCACGTCGTC CAGGCCACCA AGGACGCGCT CGACGCAGGC 
GACACCAAGT ATACCGCCGT CGTGGGCACA GCCGCCCTGC GCAGCGCCGC CGCGCTGCAC 
TTCAGCCGTG ACCTCGGCCT GGAAGTCCCG CCCTCGCAGG TGATCGTCAG TGCCGGCGGC 
AAGCAGGCGA TCTTCCACGC CCTTCTCGCC ACGCTCGATC CCGGCGACGA AGTACTGATC 
CCCAGCCCCT GGTGGGTCAG CTACCCTGAA ATCGTGCGTT TCGCCGGAGC AGAGGTCGTG 
GACCTGCCGA CCGACGCCGC AGGCGGTTTC CGCATTACGG CCGCGCAACT CGAGGCCGCA 
ATCACCCCCG CCACCCGCTG GCTGCTGCTT AACAGCCCCG GCAACCCCAC TGGCGCCACC 
TATCCGGCGC AGGAACTGCG CGCGCTGGGC GAGGTTCTGC GCCGTCATCC CCGCGTGCTG 
GTGATGAGCG ACGACATCTA TGCGCCCCTG CGTTACGGCG AGGGCCGCCA CGCCACGCTG 
GCGGTGGAGT GCCCCGATCT CGCGGATCGC ATCCTGACCG TCTCCGGCGT TTCGAAAAGC 
CACGCGATGA CCGGTTTCCG GATCGGCGTC GCCGCCGGCC CCGCATGGCT GATCTCTGCG 
ATGGGCCGCC TGCAATCGCA TTCCTCGGGC AACCCTGCCT CGATAAGCCA GGCCGCTGCG 
GTCGCCGCGT TCGAAGGCCC GCAGGACTTC CTGCTGGACT GGCGCGAGCG CTTCCGTGCG 
CGCCGGGACA TGGTCTGCGC GCGCGTTAAC GCGATCCCCG GCCTGTCCAC GCCTGTTCCC 
GATGGCGCCT TCTACTGTAT GGTCGATGCT GCGCCGTTGA TGGCGCGCTT CGGCGATGAC 
GAAGCGCTCT GCCTCCATCT GTTGGAAAGC GGCGTGGCCG TGGTGCCGGC ATCCGCGTTC 
GGCGGAAGGG ACGGCTTCCG CATCAGCTTC GCGGCGGACG AGGCGAAACT CGAAGAAGCG 
CTGCGGCGTA TAGAAAAGGC CGTTGCATGA

Protein sequence

MNQLSRALAR IAPSRTTAIT DRAIQLRAEG RDVISLSVGE PDFATPAHVV QATKDALDAG 
DTKYTAVVGT AALRSAAALH FSRDLGLEVP PSQVIVSAGG KQAIFHALLA TLDPGDEVLI 
PSPWWVSYPE IVRFAGAEVV DLPTDAAGGF RITAAQLEAA ITPATRWLLL NSPGNPTGAT 
YPAQELRALG EVLRRHPRVL VMSDDIYAPL RYGEGRHATL AVECPDLADR ILTVSGVSKS 
HAMTGFRIGV AAGPAWLISA MGRLQSHSSG NPASISQAAA VAAFEGPQDF LLDWRERFRA 
RRDMVCARVN AIPGLSTPVP DGAFYCMVDA APLMARFGDD EALCLHLLES GVAVVPASAF 
GGRDGFRISF AADEAKLEEA LRRIEKAVA