Gene Mmar10_0453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0453
Symbol
ID	4285638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	528403
End bp	529623
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	68%
IMG OID	638139916
Product	hypothetical protein
Protein accession	YP_755684
Protein GI	114569004
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.881492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACAA TCCGTCCCAG ACATATCGCC ATCATCGGTG CCGGCCCTGC CGGGCTGATC 
GCCGCTGAAC ATCTCGCCAC GCTCGGTCAC GAGGTTGACC TTTATGAGCG CATGCCGACC 
CCCGGTCGCA AATTCCTCAT GGCCGGTCGC GGCGGCCTGA ACCTGACTCA CAGCGAACCG 
TTGCCGGCCT TTCTGGGCCG CTATCGTGAG GCCGCCGACT GGTTGGGCCC GGCGATCACC 
CGGCATGATC CCGCCGCCCT GCGGGACTGG TGCGAGGGTC TGGACCAGCC AACCTTCACC 
GGATCGTCCG GTCGGGTATT TCCCGAAGCG ATGAAAGCCT CGCCGCTGTT GCGGGCCTGG 
CGCAAGCGGC TGGAATTGCA CGGTGTGTCG ATGCACCTGC GTCATACATG GACGGGCTGG 
AATGAAGACG GCGCGCTGGT CTTCCAGACG CCGGACGGTG AGGTCACAGC CTCGCCCGAA 
GCCACCCTGC TCGCCCTGGG CGGCGCCAGC TGGCCGCGCC TGGGGTCAGA TGGAAGCTGG 
ACCGGGACGC TGGCGGCGCG GGGCGTCGAG CTGGTCGGGT TCTCGGCTTC CAATTGCGGC 
GTCAATATCG ACTGGAGCGC GATCACCAAG GCGCGCTTCG CCGGTGCGCC GCTGAAGACC 
ATCGCCCTGT CTTCGGGGGA TGAACGGGTC GCGGGCGAGG CGATGATCGC GCGCTACGGG 
CTGGAAGGCG GAGCCGTCTA TGCCCTGTCC GCGGCCATTC GTGCAGCGCT GGCCAATGGC 
GACACCATCA CCCTCCATCT CGACCTCAAG CCTCACCGTG ACGTGTCTGA TCTGGCCAAC 
TGGCTGGGCA GGGCGAAGAA GGGCCAGTCG CTCACCAACA CGCTGCGCAA GGCCGGGCTG 
ACGCCGCAAG CGATTTCGGT CCTGCGCGAT GCCGTCGCCG AGCTGCCGCG CGATCCGGCG 
GCGCTGGCGG CCCTGATCAA GGCCGTGCCG CTGCGCGTGA CGGCGCAACG CGATCTCGAC 
CGGGCGATCT CCTCGGCCGG TGGCATCGCA CGCTCAGCCG TCGATGATCA CTTCATGCTG 
ACGGCGGTGC CGGGCGTTTT TGCGGCCGGT GAAATGCTCG ACTGGGATGC GCCGACCGGC 
GGCTATCTGC TGCAGGCGAG CTTCGCCACC GGCCTCGCCG CCGCACGCGG CATCGAGGCC 
TGGCTGGAAC AGACCGCCTA G

Protein sequence

MSTIRPRHIA IIGAGPAGLI AAEHLATLGH EVDLYERMPT PGRKFLMAGR GGLNLTHSEP 
LPAFLGRYRE AADWLGPAIT RHDPAALRDW CEGLDQPTFT GSSGRVFPEA MKASPLLRAW 
RKRLELHGVS MHLRHTWTGW NEDGALVFQT PDGEVTASPE ATLLALGGAS WPRLGSDGSW 
TGTLAARGVE LVGFSASNCG VNIDWSAITK ARFAGAPLKT IALSSGDERV AGEAMIARYG 
LEGGAVYALS AAIRAALANG DTITLHLDLK PHRDVSDLAN WLGRAKKGQS LTNTLRKAGL 
TPQAISVLRD AVAELPRDPA ALAALIKAVP LRVTAQRDLD RAISSAGGIA RSAVDDHFML 
TAVPGVFAAG EMLDWDAPTG GYLLQASFAT GLAAARGIEA WLEQTA