Gene Mmar10_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0855
Symbol
ID	4285856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	946429
End bp	947520
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	67%
IMG OID	638140321
Product	chorismate synthase
Protein accession	YP_756086
Protein GI	114569406
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACACA ACACGTTCGG ACATCTTTTC CGGGTCACCA CCTGGGGCGA AAGCCATGGC 
CCCTCCATCG GCGCGGTCGT CGATGGTTGC CCGGCCGGCA TTCCGCTGAC CGAAACCGAT 
CTTCAGCCCT TCCTCGACCT GCGCCGTCCG GGCACTTCGC GCCATGTCAC GCCGCGCCAG 
GAACCCGACC AGGTCCGCAT CCTGTCCGGC ACGTTCGAGG ATGACCGCAC GGACGGGCCG 
GTGACGACGG GCGCGCCGAT CAGCCTGATG ATCGAGAATA CCGACCAGCG CTCGAAGGAT 
TACAGCGCCA TCCGCGACAA ATGGCGTCCC GGCCATGCCG ACTACACCTA TGACATGAAA 
TACGGCATCC GCGATTATCG CGGCGGTGGC CGTTCCTCGG CCCGTGAGAC GGCCATGCGG 
GTCGCCGCCG GCGGCATTGC CCGCAAGGTG CTGGGCGACG GCATCTCGAT CCGCGCCGCG 
CTGGTGCAAG TGGGTGATCG CGCCATCGAC CGTAGCCGCT GGGACTGGGA CGAGGTGAGC 
AACAACCCTT TCTTCTGCCC CGACGCCACA ACCGCCGCCC TGTGGGAAGC GGACATGGAC 
GCGCTGCGCC GGGCTGGTTC ATCGACCGGC GCCATCGTCG AAGTCGTGGT CTCCGGCGTC 
CCGGTCGGCT GGGGTGCCCC CGTCTATGCC AAGCTCGACA GTGAGCTGGC CGCCGCCATG 
ATGACCATCA ATGCGGTCAA GGGCGTCGAG ATCGGGGCCG GGTTCGGCTC GGCCGCGATG 
CGCGGTGAAG ACGCCGCGGA CGAGATGCGC ATGGGCGAGG ACGGGCCGGT CTTTTTGTCC 
AACCATAATG GCGGCGTGCT GGGCGGCATT TCGACCGGGC AGGACCTGGT GGTCCGCTTT 
GCCGTCAAAC CGACCTCCTC GATCACGGTC GAGCGCAACA CGCTGGACCG CAATTTCGAG 
GAGACCGTGA TCGAGACCCG CGGCCGCCAT GACCCCTGCG TCGGCATCCG TGCCGTCCCG 
GTCGGCGAGG CCATGGCAGC GCTGGTCCTG GCCGACCAGA AGCTGCGCCA TGCGGGCCAA 
TCGGCGTACT GA

Protein sequence

MSHNTFGHLF RVTTWGESHG PSIGAVVDGC PAGIPLTETD LQPFLDLRRP GTSRHVTPRQ 
EPDQVRILSG TFEDDRTDGP VTTGAPISLM IENTDQRSKD YSAIRDKWRP GHADYTYDMK 
YGIRDYRGGG RSSARETAMR VAAGGIARKV LGDGISIRAA LVQVGDRAID RSRWDWDEVS 
NNPFFCPDAT TAALWEADMD ALRRAGSSTG AIVEVVVSGV PVGWGAPVYA KLDSELAAAM 
MTINAVKGVE IGAGFGSAAM RGEDAADEMR MGEDGPVFLS NHNGGVLGGI STGQDLVVRF 
AVKPTSSITV ERNTLDRNFE ETVIETRGRH DPCVGIRAVP VGEAMAALVL ADQKLRHAGQ 
SAY