Gene Daro_3481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3481
Symbol
ID	3566941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3729507
End bp	3730982
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	62%
IMG OID	637681953
Product	anthranilate synthase component I
Protein accession	YP_286680
Protein GI	71909093
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.219559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAA CCGAATTCAA TTCGCTTGCC GCGCAAGGCT ACAACCGTAT TCCCGTCACG 
CTGGAAACGT TTGCCGATCT CGACACGCCG CTCTCCATCT ACCTGAAGCT GGCCAATGCG 
CCCTACACCT ACTTGCTCGA ATCGGTGCAG GGCGGTGAGC GCTTCGGTCG CTACTCGATC 
ATCGGTCTGG CTGCCCAGAC GCGTATCGTC GTCAATGGCC ACCAGGTGCT GGTGCTGACC 
GGCAACCGTA TCGCCGAGCG TGAAAACGAC ACCAACCCGC TGGAATTCAT CGGCAAGTTC 
ATGCAGCGCT TCCGGGCGCC GCCGGCGAAC GGCCTGCCAC GCTTCTGCGG CGGCCTGGTC 
GGTTGCTTCG GCTACGACAC CGTGCGTTAC GTCGAAACCC GCCTGACCCG CACCAACAAG 
CCGGACGAAA TCGGCACGCC GGACATCGGC CTATTGCTTT CCGAAGAAAT CGCTGTCGTC 
GACAACCTGT CCGGCAAGCT GACGCTGATC GTCTATGCCG AGCCCGGCTT CCCCGGTGCC 
TATCAGAAGG CCCGCGCCCG TCTCAAGGAA TTGCTGCAGA AACTGCGCAC GCCGGTCTCC 
CTGCCCAGCG AGCAGCCGGT CCATTCGGAA GCGGCCGTTT CCGTCTTTGG CGAAGCGGCC 
TTCAAGCAGG CTGTGCTCAA GGCCAAGGCC TACATCACCG AAGGTGACAT CATGCAGGTC 
GTGCTGTCGC AGCGCATGAC CAAGCCCTTC CTGGCGAGCC CTCTGGCGCT CTATCGCACC 
CTGCGCAGCC TGAATCCGTC GCCCTACATG TTCTACTTCG ACTTCGAGGA TTTCCACGTG 
GTCGGCGCCT CGCCGGAGAT TCTGGTTCGC CTCGAAGGCG AGCGCGTCAC GGTTCGGCCG 
ATTGCCGGCA CCCGCAAGCG CGGTGCTTCG CCGGAAGAGG ATGCAGCTCT GGCCGTCGAA 
CTGCTGGCCG ATGAAAAAGA ACGGGCCGAA CATACCCAGT TGCTCGACCT CGGCCGCAAC 
GACTGCGGGC GTGTCGCGCG TGTCGGTTCG GTCAAGCTGA CCGAAAACAT GATCGTCGAG 
CGTTATTCGC ACGTGATGCA TATCGTTTCC AATGTCGAGG GCAAGCTGCA GCCGGGTCTG 
GATGCACTTG ACGTGCTGCG CGCCACCTTC CCGGCCGGCA CCGTCTCCGG TGCGCCCAAG 
GTGCGGGCGA TGGAAATCAT CGACGAACTG GAACCGGTCA AGCGTGGCAT CTACGCCGGT 
TCGGTCGGCT ATCTCGGTTT CAACGGCGAC ATGGATGTGG CCATTGCCAT CCGCACGGCT 
GTGCTCAAGG ACAAGAAGCT CTATGTGCAG GCCGGTGCCG GGATCGTCGC CGATTCCGAT 
CCGAATTCGG AATGGACCGA AACCCTGAAC AAGGCGCGTG CCGTGCTGCG TGCGGCCGAA 
CTGGCCGAGC AGGGTCTGGA TACAAGGATC GACTGA

Protein sequence

MTETEFNSLA AQGYNRIPVT LETFADLDTP LSIYLKLANA PYTYLLESVQ GGERFGRYSI 
IGLAAQTRIV VNGHQVLVLT GNRIAEREND TNPLEFIGKF MQRFRAPPAN GLPRFCGGLV 
GCFGYDTVRY VETRLTRTNK PDEIGTPDIG LLLSEEIAVV DNLSGKLTLI VYAEPGFPGA 
YQKARARLKE LLQKLRTPVS LPSEQPVHSE AAVSVFGEAA FKQAVLKAKA YITEGDIMQV 
VLSQRMTKPF LASPLALYRT LRSLNPSPYM FYFDFEDFHV VGASPEILVR LEGERVTVRP 
IAGTRKRGAS PEEDAALAVE LLADEKERAE HTQLLDLGRN DCGRVARVGS VKLTENMIVE 
RYSHVMHIVS NVEGKLQPGL DALDVLRATF PAGTVSGAPK VRAMEIIDEL EPVKRGIYAG 
SVGYLGFNGD MDVAIAIRTA VLKDKKLYVQ AGAGIVADSD PNSEWTETLN KARAVLRAAE 
LAEQGLDTRI D