Gene Bind_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1868
Symbol
ID	6198852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2128559
End bp	2129680
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	60%
IMG OID	641705855
Product	chorismate synthase
Protein accession	YP_001832981
Protein GI	182678835
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.423516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCACA ATACATTCGG CCATCTCTTT CGCGTGACGA CCTTTGGGGA AAGCCATGGA 
CCGGCCATTG GCTGCGTGGT GGATGGTTGC CCTCCCTTGA TCCCAATCGA TGAAGCCGAC 
ATCCAGACCT TTCTCGATCT GCGCCGTCCC GGCACGTCGC GTTTCACGAC ACAGCGCCAG 
GAAGCCGATC GTGTGCGTAT CCTCTCGGGT GTCTTCACGG ACGAGGCGAG CGGCAAACAG 
GTTTCGACGG GCACACCGAT CGCGCTCCTG ATCGAAAATA CGGATCAGCG CTCGAAGGAT 
TATGACGCGA TCAAAAATCT CTATCGACCA GGCCATGCCG ATTTCGCCTA TGACGCAAAA 
TATGGCTTGC GTGATCATCG TGGCGGGGGC CGTTCCTCGG CGCGCGAAAC CGCGACGCGG 
GTCGCAGCCG GTGCCATCGC CCGCAAGGTG GTCGCGGATG TGACGATCAG AGGGGCCCTC 
GTGCAGATGG GGCCGCATAA GATCAACCGC GACGCGTGGG ATTGGGACGA GACGACGCGC 
AATCCCTTCT TCTGCCCGGA TGCAAAGGCG GCGGCTTTTT TTGAAACTTA TCTCGATGAT 
ATACGCAAGG CCGGGTCCTC GATTGGCGCG GTCATTGAGA TCGTCGCGGA GAATGTGCCG 
GCCGGCTGGG GCGCTCCGCT TTATGGCAAG CTCGACGCTG ATCTTGCTTC CGGCTTGATG 
TCGATCAATG CGGTGAAAGG TGTCGAAATC GGCGAGGGTT TTGACGCGGC CGCGCTGAGC 
GGTGAAGCCA ATGCCGATGA AATGCGGATC GGTTCTCTCG GCGAGCCGGT CTTTCTCTCG 
AACCATGCGG GCGGCATTCT GGGGGGTATT TCGACGGGCC AGCCGCTCGT CATGCGCTTT 
GCTGTCAAAC CGACCTCTTC GATCCTGCAA CCGCGTCATA CGATCGACCG TTCAGGCCAT 
GAAAGCGAGA TCGTCACTAA GGGGCGTCAT GATCCGTGTG TCGGCATACG CGCCGTGCCG 
GTGGGCGAGG CCATGGTCGC TTGCGTGCTC GCCGATCATT TTCTGCGCCA TCGCGGCCAG 
ATCGGTGAAG GCGCTGTCTG GCCGGCGAAC CGATCACGCT GA

Protein sequence

MSHNTFGHLF RVTTFGESHG PAIGCVVDGC PPLIPIDEAD IQTFLDLRRP GTSRFTTQRQ 
EADRVRILSG VFTDEASGKQ VSTGTPIALL IENTDQRSKD YDAIKNLYRP GHADFAYDAK 
YGLRDHRGGG RSSARETATR VAAGAIARKV VADVTIRGAL VQMGPHKINR DAWDWDETTR 
NPFFCPDAKA AAFFETYLDD IRKAGSSIGA VIEIVAENVP AGWGAPLYGK LDADLASGLM 
SINAVKGVEI GEGFDAAALS GEANADEMRI GSLGEPVFLS NHAGGILGGI STGQPLVMRF 
AVKPTSSILQ PRHTIDRSGH ESEIVTKGRH DPCVGIRAVP VGEAMVACVL ADHFLRHRGQ 
IGEGAVWPAN RSR