Gene Daro_0858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0858
Symbol
ID	3569845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	930041
End bp	931141
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	59%
IMG OID	637679316
Product	chorismate synthase
Protein accession	YP_284084
Protein GI	71906497
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	5.52804e-17
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000936669
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGTCCGGCA ATACATTTGG TACTTTGTTT ACTGTTACCT CTTTTGGTGA GTCGCATGGC 
CCGGCCATTG GCTGCGTGGT TGACGGTTGT CCGCCGGGGC TGGCCTTATG CGAGGCCGAT 
ATACAGGCGG AACTGGATCG CCGCAAACCG GGTACTTCTC GTCATGTGAC GCAGCGCCGC 
GAACCGGATA CTGTTGAGAT TCTCTCCGGT GTCTTCGAGG GGAAGACGAC CGGCACACCG 
ATTGGCTTGT TGATTCGCAA CCAGGACCAG CGCAGCAAGG ATTACGGCAA CATTGCCGAT 
ACTTTCCGTC CTGGCCATGC CGACTATGCC TACACCCAGA AATACGGATT TCGTGACTAT 
CGTGGCGGTG GCCGTTCGTC AGCCCGCGAG ACGGCGGTGC GCGTGGCGGC CGGGGCGATT 
GCCCGCAAGT GGCTGCACGA ACGCTTCGGG GTGGCGATTC GTGGCTGGAT GAGTGCGCTC 
GGGCCAATCG AAATTCCGTT TGTTAGTGCT GATGCGATTG ATGGCAACGC CTTCTTTGCG 
CCGAATTCGG CCATCGTGCC GGAGCTGGAG GCTTATATGG ATAAGCTGCG CAAGTCGCTG 
GACTCTGTGG GCGCCAAGAT CACTGTAACC GCTACCGGTG TGCCTCCGGG TTGGGGTGAG 
CCGGTCTATG ATCGGCTCGA TGCCGAGATC GCCTACGCGA TGATGGGGAT CAATGCCGTC 
AAGGGGGTTG AAATCGGTGC CGGTTTCGAT TCGGTCGCCC AGAAAGGCAG CGAGCATGGC 
GATGAAATGA CGCCACAGGG CTTTGCGACC AACCATGCCG GTGGTGTGCT CGGTGGTATT 
TCGACAGGGC AGGAAATCGT GGTCAATATG GCGATCAAGC CGACCTCGTC AATTGCCCAG 
TCGCGCCGCT CGATCAATCG CCAGGGGGAG GCTATTGAGG TGGCAACCGA GGGGCGGCAT 
GACCCCTGTG TCGGCATTCG TGCCACGCCG ATTGCCGAAG CGATGCTGGC CTTGGTTCTG 
ATGGATCATG CTTTGCGTCA TCGTGCCCAG TGTGGCGATG TGCTATGTGC GACGCCGCGC 
ATTCCGGGGA AAATCGCGTA G

Protein sequence

MSGNTFGTLF TVTSFGESHG PAIGCVVDGC PPGLALCEAD IQAELDRRKP GTSRHVTQRR 
EPDTVEILSG VFEGKTTGTP IGLLIRNQDQ RSKDYGNIAD TFRPGHADYA YTQKYGFRDY 
RGGGRSSARE TAVRVAAGAI ARKWLHERFG VAIRGWMSAL GPIEIPFVSA DAIDGNAFFA 
PNSAIVPELE AYMDKLRKSL DSVGAKITVT ATGVPPGWGE PVYDRLDAEI AYAMMGINAV 
KGVEIGAGFD SVAQKGSEHG DEMTPQGFAT NHAGGVLGGI STGQEIVVNM AIKPTSSIAQ 
SRRSINRQGE AIEVATEGRH DPCVGIRATP IAEAMLALVL MDHALRHRAQ CGDVLCATPR 
IPGKIA