Gene Mmar10_2150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_2150
Symbol
ID	4284769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2347701
End bp	2349923
Gene Length	2223 bp
Protein Length	740 aa
Translation table	11
GC content	68%
IMG OID	638141652
Product	vault protein inter-alpha-trypsin subunit
Protein accession	YP_757380
Protein GI	114570700
COG category	[R] General function prediction only
COG ID	[COG2425] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.270447
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCG CACACACTCA CCACTCGGCA GGCTCACAGG CCTGGTTCGC ACTCACACTG 
GCGATCGCGG CCCTGGCCGC TTCGGCGCTG CTCTGGTCGG AGGCCCGCGC CGATGTGCCG 
GAGCCGGTCG AGATCGGCGA AAGCGACATG GTCCGCCTGT CCGAGATCAA TGAGGGCGCC 
CTCCTGATCA AGACCATCCA GCCCGGCCGC TATATTCCCG CCCCGATGGT CGCCACCGAC 
ATCGACTTCG ACATTTCCGG ACCGGTCGTG CGCGCCACCA TCACCCAGCG CTTCGAAAAT 
CCGACCGACG CCTGGGTCGA GGCGACCTAT GTCTTCCCGA TGCCCGAAGA CAGCGGTGTC 
GACCGGCTGC GCATGCAGGT CGGAGACCGC TTCATCGAGG GCGAGATCCA GGAACGCCAG 
GCCGCCCGCC GCACCTATGA GGCCGCCCGC GCCAATGGCC AGCGCGCCAG CCTGGTCGAG 
CAGGAACGGC CCAACATGTT CACCACCTCG GTCGCCAATA TCGGGCCAGG CGAGACCATC 
ATCGTCCAGT TCGAATACCA GGATGTGGCG CGCTTCGTGG ATGGACGCTT CCAGCTGACC 
CAGCCGCTCG GCCTGACACC ACGCTACATT CCGGACGGGG GCGACTTCCA GATGGTTTCG 
ACCGACAGCT CGTCAGTCCC TGACGCGTCG CGCATTACCC CGCCGGTCAT GCCGGCATCG 
CTGGAGCCGC GAGACCAGCT GCGTCTGCCG GTCACGATCA CCGCCGATCT GGACGCCGGC 
TATGCGCTGG GCGAGATCGC CAGCCTCTAC CACGCCACGC TGGTCGAGCG GCGAAGCGAC 
GGAACGGCCC GCATCAGCCT CGCCGACGGC CCCATCCCGG CCAATCGCGA CTTTGTCCTG 
ACCTGGCGCG CCGCCGACCC GAGCGAAGCG AGCGCCGCCC TCTTCATCGA GGAATGGCAG 
GGGGAGACCT ATCTGCTGGC CCAGATCCTG CCGCCCGCCG AGCTGGGCGC CGATACGCCG 
CGCCGGGCCC GCGAAACGAT TTTCGTGATC GACAATTCCG GCTCGATGGG CGGCGCCTCC 
ATGCGCCAGG CCCGTGCCGC CCTGATCACG GCCCTGCAAC GCCTGGAGCC GGGTGACCGC 
TTCAATGTCA TCCGCTTCGA CAATACGATG GAACAGGTCT TTCCGCAGGC AGTGGATGCC 
TCGCCGGACA ATGTCGCGAC CGCCCTGACC TTCGCCCGCC GGCTGGAAGC GCAAGGCGGC 
ACAGTGATGC TGCCGGCTCT CAACGCCGCG CTGCGCGACA CCAGCCCCGA CGATGATAGC 
CGGGTCCGCC AGATCGTCTT CCTGACCGAT GGTGCAATCG GCAATGAGGC CGAACTCTTC 
GCCGCCATCG AGGCCGGCCT CGGGCGATCG CGCCTGTTCC CGGTCGGAAT CGGATCGGCC 
CCGAACGGCT ATTTCATGAG CCGCGCCGCG CGGCTGGGAC GAGGTACCTC GACCCAGATC 
GGACAGGTCA GCGAAGTCGA GGCCCGCATG GAAGAGCTTT TCACGGCGCT GGAACGTCCG 
GTCATGACCG ATCTCGACGC CCTCTTTCCT GAAGGGGCGC TGAGCGAAAT CTGGCCGGCG 
CCGCTGCCCG ATCTCTATTA CGGCGAACCG GTCACCCTGA CCGCCCGCCT GGCCAGCCGC 
AACGGCAACA TGGTCATCGA AGGCGAGACC GCCGGGGCGC GCTGGCGCGA GACCCTTTCC 
CTCGCCGACG CCCATGAGGG ACACGGCATC GCCACCCTGT TTGGCCGCAA CCGGATCCGC 
GCCCTCGAAG AGACCCGCTT CCAGGGTGTG GCCGCCAGCC GGATCGACGC GGCGGTACTG 
GAAACCGCGC TCGATTTCAG CCTGGTCTCC CGCCTGACCA GCCTGGTCGC GGTCGATATC 
ACCCCGGCAA GACCGGATGG AACACCATTG GCCAGCCGCG ACGTCCCCAC CATGATCCCG 
GACGGCTGGA ACCTGGATGC TGTTGAGCGC GAGGCGGCGC CTCTTGTCCG CCATGCCGCC 
GCCGATGCCC GCCTGTTCGC TGCCCGGCCC GCCCCCATGG CTGGCGCAAC CGCCGCTGAC 
AGCGCCGGTC TGGCCCTGCC CGCCACCGCC ACACCGCGGC AGGTCCTGAT GATACTGGGC 
GCGTTGATGA TGCTGCTCGC CCTGATCTGG CTGATCACCC GCCGCGAGGA GCGCCTGTGG 
TGA

Protein sequence

MATAHTHHSA GSQAWFALTL AIAALAASAL LWSEARADVP EPVEIGESDM VRLSEINEGA 
LLIKTIQPGR YIPAPMVATD IDFDISGPVV RATITQRFEN PTDAWVEATY VFPMPEDSGV 
DRLRMQVGDR FIEGEIQERQ AARRTYEAAR ANGQRASLVE QERPNMFTTS VANIGPGETI 
IVQFEYQDVA RFVDGRFQLT QPLGLTPRYI PDGGDFQMVS TDSSSVPDAS RITPPVMPAS 
LEPRDQLRLP VTITADLDAG YALGEIASLY HATLVERRSD GTARISLADG PIPANRDFVL 
TWRAADPSEA SAALFIEEWQ GETYLLAQIL PPAELGADTP RRARETIFVI DNSGSMGGAS 
MRQARAALIT ALQRLEPGDR FNVIRFDNTM EQVFPQAVDA SPDNVATALT FARRLEAQGG 
TVMLPALNAA LRDTSPDDDS RVRQIVFLTD GAIGNEAELF AAIEAGLGRS RLFPVGIGSA 
PNGYFMSRAA RLGRGTSTQI GQVSEVEARM EELFTALERP VMTDLDALFP EGALSEIWPA 
PLPDLYYGEP VTLTARLASR NGNMVIEGET AGARWRETLS LADAHEGHGI ATLFGRNRIR 
ALEETRFQGV AASRIDAAVL ETALDFSLVS RLTSLVAVDI TPARPDGTPL ASRDVPTMIP 
DGWNLDAVER EAAPLVRHAA ADARLFAARP APMAGATAAD SAGLALPATA TPRQVLMILG 
ALMMLLALIW LITRREERLW