Gene MCA0813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0813
Symbol	sqs
ID	3102259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	855386
End bp	856474
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	64%
IMG OID	637170019
Product	squalene synthase
Protein accession	YP_113313
Protein GI	53804819
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.493188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGAA CACCCCCCTC ACAGCCCGCC AGACATGAGC ATCTGTCGGA CGACGAATTC 
CAGGCCCATT TCCTGGACGG CGTATCCCGT ACTTTCGCTT TGACGATCCC GAGGCTGCCG 
GAAGGTTTGG CCCGTCCGGT ATCCAACGGC TACCTGCTGT GCCGTATCGT CGACACCATC 
GAAGACGAGG TGGCGCTGAC GTCGACCCAA AAGCGGCGAT ATTGCGAGCA TTTCGCCCGG 
GTCGTCGCCG GAACGGCACC CGCTGCCCCG CTCGCCGACG AACTCTTTCC ACTGCTCTCC 
GACCAGACCC TGGCCGCCGA GCGGGAGCTG ATCGCCGCCA TTCCGCGCGT CATCAGCATC 
ACCCATGGCT TCGCCGCGCC GCAGCAGGAG GCACTGGCCG AGTGCGTGGC CACGATGTCT 
AGAGGAATGG CCGAGTTTCA GGACAAGGAC CTGCGGCACG GTCTCGAGGA CCTGCGACAG 
ATGGGCGATT ACTGCTATTA CGTCGCCGGC GTGGTCGGAG AAATGCTGAC TCGGCTGTTC 
TGTCACTACT CCCCGGAAAT CGCCGCACAT CGGTCGCGGC TGATGGAACT CGCGGTGTCC 
TTCGGACAGG GACTGCAGAT GACCAACATA CTGAAGGACC TGTGGGATGA CCATGCGCGC 
GGCGTCTGCT GGCTGCCGCA GGAGGTGTTC ACGGAATGCG GTTTCTCCCT CACCGAGCTC 
CGGCCGCACC ACGCCAACCC CGATTTCGTC CGCGGCTTCG AGCGACTGAT CGGCGTGGCC 
CACGCCCACC TGCGCAATGC GCTGGAATAT ACGTTGCTGA TCCCGCGCCA TGAAACCGGC 
ATCCGCGAAT TCTGCCTCTG GGCTCTGGGG ATGGCGGTGC TCACGCTGCG CAAGATCCAT 
CGTCACCCCT ATTTCAGTGA TTCCGCCCAG GTGAAGATCA CACGGCAGGC AGTCAAGGCG 
ACGATCGTCA CCTCGCGGCT GACCCGCGGC AGCGACACCT TGCTGAAAGC CACGTTCCGG 
CTCGCCGGTC TCGGCCTGCC CGCCGCGGTG CCTGCCGCTG TGCTGCAGCC CCGGCCCATC 
GACATTTGA

Protein sequence

MSGTPPSQPA RHEHLSDDEF QAHFLDGVSR TFALTIPRLP EGLARPVSNG YLLCRIVDTI 
EDEVALTSTQ KRRYCEHFAR VVAGTAPAAP LADELFPLLS DQTLAAEREL IAAIPRVISI 
THGFAAPQQE ALAECVATMS RGMAEFQDKD LRHGLEDLRQ MGDYCYYVAG VVGEMLTRLF 
CHYSPEIAAH RSRLMELAVS FGQGLQMTNI LKDLWDDHAR GVCWLPQEVF TECGFSLTEL 
RPHHANPDFV RGFERLIGVA HAHLRNALEY TLLIPRHETG IREFCLWALG MAVLTLRKIH 
RHPYFSDSAQ VKITRQAVKA TIVTSRLTRG SDTLLKATFR LAGLGLPAAV PAAVLQPRPI 
DI