Gene Mmar10_0367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0367
Symbol
ID	4284887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	434136
End bp	435716
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	64%
IMG OID	638139830
Product	glycosyl transferase family protein
Protein accession	YP_755598
Protein GI	114568918
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAGT CATTCAATGC GTCTCCACTG AGTCGGGACA ACTGGACACG CGCCGCAATC 
GTGCTCATCG CCGGCTTCGC GGTCCTCCGC ATCCTCGCCC TCGCGATCAG CCCGGTATCG 
CTCTATCAGG ACGAGTCCCA ATACTGGGTC TGGTCGCGCC AGTTCGACTG GGGCTATTAT 
TCCAAACCAC CGATGATCGC CTGGCTGATC AGCCTGTCGA CCGGCCTGTT CGGCGACAGT 
GATTTCGCGA TCCGCCTGCC GGCAACCCTG CTGCATACCG CAACCGCGAC TTTCCTCATG 
CTGAGCGCGC GCCAGTTGTG GGATGAGCGG GCCGGTTTCT GGACGGCGGC CCTGTATCTC 
ACCATGCCGG GCATCTGGCT GTCAGGCTTC GTGATCTCCA CTGATGCCGT GCTTTTCGTG 
GCCTGGTCGG GCGGATTGTA CGCCCTGCTC CGTTTACGGG CGGATCATGG ATGGGGCGCC 
GCAATCGGGT TGGGCGTCGC CCTGGGCTTC GGCTTCCTGT CAAAATACGC GATGATCTAT 
TTTCTGGTCT CGACCGGTCT GGCCATCCTC TTTGACGCAC CCACGCGCCG GGCCTTGCTG 
GGCCTTCGCG GCGCGGCTGC CCTCGCCATT TTCCTGGCCC TTCTCGCCCC CAACCTGGCC 
TGGAATGCGG CCAATGACTT TGCGACCGTC ACCCATACGG CCGCCAATGC CAATTGGGGC 
GGCGACCTGT TCCATCCCGG CGAATTATTC GAGTTTCTGG CCGCCCAGCT CGGGGTGTTC 
GGCCCGGTCA CATTCGGTGT TCTGGCGACC ATTTTCGGTC TCACCATCGC GAGCTTCCTG 
CGGGCCGATC CGGATCAGCG CCTGCTGGTT CTCTATTCCG TGCCGCCGCT GGCGGTCGTC 
GCTGTTCAGG CCTTCATTTC ACGCGCTCAC GCCAACTGGG CCGCCGCGAC CTATGTTGCC 
GGGACCTTGC TGGTTGTCGG GTTTTTGTTG CGCGGTGCAA CATGGCGACG CTGGGCGTTG 
TACGGGTCGA TCGGACTGCA CACCGTCATC GGTATCATCG CCATTGCACT GGCCGCCAGC 
CCGGCTCTCG TGGTTGCCCT CGGGGCAGCC GATGCGACCA AGCGCATTCG CGCCTGGGAC 
GTCACCGCCG AACAGATCCT CGCCGCGGCA GAGTCTGATG ACTATGCGAT GATCGTCTTT 
GACGACCGCA ATGCCTTCCA CCAGATGCAA CGCTATGCCC CGCAGCTGGA GGGCCGCATG 
GCCATGTGGC TGCGCTATTC CGGACCGACC AACCACGCCG AGGATGTCTG GCCCCTGTCA 
GAGGATCAGG CCGGTCGCCT GCTGGTGATC TCGAACCGGC CCCGCGAAGT GCCGCGGCTG 
CGTGAGGATT TCGACAGGTT TGAAGCGGTC GGCCGCTTAG CCATACCGCT GGACGGCGCC 
TATACGCGTG ACTTCACCCT GTGGGAAGCC GAGGGCTATC AGCGGGTCGA ACGCGACGAG 
GCCTATGAAA TCCGGTGGCA GGCATTTGAT GCGTCGGATG AGGCGCCCCC CGCACGCGGC 
TATAGCGGAG AGGGGCGGTA G

Protein sequence

MPESFNASPL SRDNWTRAAI VLIAGFAVLR ILALAISPVS LYQDESQYWV WSRQFDWGYY 
SKPPMIAWLI SLSTGLFGDS DFAIRLPATL LHTATATFLM LSARQLWDER AGFWTAALYL 
TMPGIWLSGF VISTDAVLFV AWSGGLYALL RLRADHGWGA AIGLGVALGF GFLSKYAMIY 
FLVSTGLAIL FDAPTRRALL GLRGAAALAI FLALLAPNLA WNAANDFATV THTAANANWG 
GDLFHPGELF EFLAAQLGVF GPVTFGVLAT IFGLTIASFL RADPDQRLLV LYSVPPLAVV 
AVQAFISRAH ANWAAATYVA GTLLVVGFLL RGATWRRWAL YGSIGLHTVI GIIAIALAAS 
PALVVALGAA DATKRIRAWD VTAEQILAAA ESDDYAMIVF DDRNAFHQMQ RYAPQLEGRM 
AMWLRYSGPT NHAEDVWPLS EDQAGRLLVI SNRPREVPRL REDFDRFEAV GRLAIPLDGA 
YTRDFTLWEA EGYQRVERDE AYEIRWQAFD ASDEAPPARG YSGEGR