Gene Mmar10_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1404
Symbol
ID	4284636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	1539658
End bp	1541595
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	62%
IMG OID	638140886
Product	hypothetical protein
Protein accession	YP_756634
Protein GI	114569954
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.15542
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.00031437
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTTCCA ATTTTCGTGC TTTCGCCCAG TCGCCCATAG CGCTGATCAT CATTGTCCTG 
CTGGTATTGT CTTTCGCGAT TGCCATGCCG GGCGCCGGCG GCATCTTCAC CGGCAGCGGT 
GATGCAGTGG TCGTGGTTGG CCCCGAACGG ATCAGCCAGC GGGAAATGGC GACAGCCTTC 
AATCGCGAGG TTGCCCGCCT GCAAGAGCAG AACCCGGACG TGACCCGCGA AATGGCGCGC 
GAGGAAGGGA TCGCCTACCA GGTCCTGCAA CAGCAGATCA CCATGGCAAC CATGGCCGCC 
CGGGCCCGGG ATCTGGGCCT GGCCATATCC GATGTCGCCA TCGTCAGCGA AGTTGCCGAC 
GTCCCGGCCT TCCAGAATCC GATCACGGAA CGCTTCGATC GTGACACCAT GGCGGCCGCG 
CTGCAGCGCT CGGGCGTGAC CGAAGACCAA TTCGCCCGTG ATATCGAAGG TGACCTGTTG 
CGGTCGCAAT TGATGGCCAC CCTGGCCGGC TTCAGCGATG TCCCCGACCA GATCGCCGCG 
ACCCGCTATC TCGTTGCCGA GGAACAGCGC CGGATGACCG GCCTCGTGAT CGACGCCTCG 
ACCGCCGACG AGATCGAGGA CCCGACGGAT GAGACCCTGC AAACCTTCAT TGACGAGACC 
CTCGGCGCCA ATGGCGAGCC GGTCTTCACT CGCCCGGAAT ACCGCGCCAT CACGCTCGTG 
CGTTTCCAGC TCGATGACTT CATCCGCGAT GTCGCTGTTG ATGAAGCGAC CCTGCGGGAG 
GTCTATGACT ATGAAATTGC GACCAACCAG ATCGGGACGC CCGCCTATCG CAGCTTCACC 
CAGCTGACCG TCAGTGATCA GGCGGGTGCC GATGACGCAG CCAGCCGTCT CGCCGCGGGC 
GAAGCCCCGT CTGCCGTTGC CGCCGAGCTG GGCCTCGACA CGCCGCTGGT CCAGACCGAT 
GTCCAGCAAT TCGAGATCCC CGACGAGGGT CTTGGTGAAA CCGTATTTGC CATGTCGGCC 
GGTGAGGCCC GCGCGGTTGA GGGACGTTTT GGCTGGAGCG CCGTGATTAT TACTGGCGCC 
GAAGAGGCGA CCCAGCCTGC ATTTGAGGAA GAGCGTCCGC GGCTGCAGGC CGATGCGGCC 
CGGGCCCAGG CGACGGACGA CATGTATGAT GCCATCTCGG CGTTCGAAAC CGTTCGCGCA 
ACCGGTGCTT CGCTCGAGGT CGCTGCCGAG GAATCCGGTA CGCCGCTGGA AATCTTCCAG 
CCTCTCGCCG TGAATTCGAT CGACGAGGAC CTGCAATTTG ATGGCGAACG CTACCAGGCA 
CTCGCCCCTG AAATCCTGCC GGCGGCCTTC GATCACATCG AGGGATTCGC CACCAATCTG 
GAAAGCTATA ACGAGACCGA TTTCTACACG CTTCGCGTCG ACGAGATCAT CCAGAGCCGT 
CCGTTCGAAC TGGAAGAAAT CCGTGAACAG GCCGAGAGCC GCTGGCGCTC GATCCAGGTC 
GACACCCAAT TGCAGGCTCG TGCCGAGGAT GCGCTGGCCC AGCTTGAAGC CGGTTCCGAC 
ATGGAAATCG TCAGCCTGAT GGTTGGTGGG CGCACGGAAA CCTCGACCCT GAAACGCGGT 
CAGACGGCGG GTGGCTTTGA TCGCAATGCG GTTGCCCTCG CCTTCACGAC GGACCCTGGC 
GCCTACGAAA TGATTCAGGT GGGCGAAGGC CAATACCTGG TTCTCACCGT CAACGAGATC 
ATCCCGGCCG ACATCGCCGC GGCCCCCGCC GCCGACCTTG CTGGGATCGA AACCAGCCTG 
ACCACCGAGC TGGGCAATGA CATCGTTTCG GCGACCCGGG AATACCTGAT CCGCGATTAC 
GGTATCACGG ACGAGTCGAT CGACAATCGC CTGTATTCGC TCGCCATTGG TGAGACCGAT 
CCCAGCACAC GGCAATGA

Protein sequence

MLSNFRAFAQ SPIALIIIVL LVLSFAIAMP GAGGIFTGSG DAVVVVGPER ISQREMATAF 
NREVARLQEQ NPDVTREMAR EEGIAYQVLQ QQITMATMAA RARDLGLAIS DVAIVSEVAD 
VPAFQNPITE RFDRDTMAAA LQRSGVTEDQ FARDIEGDLL RSQLMATLAG FSDVPDQIAA 
TRYLVAEEQR RMTGLVIDAS TADEIEDPTD ETLQTFIDET LGANGEPVFT RPEYRAITLV 
RFQLDDFIRD VAVDEATLRE VYDYEIATNQ IGTPAYRSFT QLTVSDQAGA DDAASRLAAG 
EAPSAVAAEL GLDTPLVQTD VQQFEIPDEG LGETVFAMSA GEARAVEGRF GWSAVIITGA 
EEATQPAFEE ERPRLQADAA RAQATDDMYD AISAFETVRA TGASLEVAAE ESGTPLEIFQ 
PLAVNSIDED LQFDGERYQA LAPEILPAAF DHIEGFATNL ESYNETDFYT LRVDEIIQSR 
PFELEEIREQ AESRWRSIQV DTQLQARAED ALAQLEAGSD MEIVSLMVGG RTETSTLKRG 
QTAGGFDRNA VALAFTTDPG AYEMIQVGEG QYLVLTVNEI IPADIAAAPA ADLAGIETSL 
TTELGNDIVS ATREYLIRDY GITDESIDNR LYSLAIGETD PSTRQ