Gene Cmaq_1463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1463
Symbol
ID	5709346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1540444
End bp	1541652
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	45%
IMG OID	641275972
Product	polysaccharide biosynthesis protein
Protein accession	YP_001541277
Protein GI	159042025
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0435937
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.00981325
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAGTG AATCCTCGGT GTCTGGGGTT ATTACTGGAT ACTTAGCATC CGCCGTGATA 
TACGTCATAA TACTAACCAG GTTAATACCC CTGACACAGT ACGGTTATTA CAACTCACTC 
CTAGCAATGA TGGGGATATT CTCACTCTTC TTCCCAACCC TGGGCATCGA CGTGGCTATT 
GCCAGGGAGG CTGCCATGCT CCATGCCAGG GACATGCCCT TTGAGGGACA CATGGCCGCC 
ATACTCCTCA TCTCAATAAT ACTGACCACC GCATACTCAC TAACGTTATT CCTCGCAATA 
CCCCTGTACA TAATTAGTAA GATACCCAGT TACTACCTGG GTATTGTTTA CATATACATT 
GCCTGGATAA TAACCCAGGC ATTTACCGGC GTTCTCTCAA CATACCTATG GATAATGAGC 
AAGCTCAGGT CCCAGGGTGT TGGGAATATG CTCTACAGCC TTGTCTTTAG GCCCCTTGAG 
GTTGCCCTAT TAGTGGTAAT GCACAGTGTC TACGCGATTA TAATATCCAT ACTAATTGGT 
CAATTAACAG CGCTCCTCTA CTACATGTTA ATTATAAGGC GATTACCAAA CCCACTGAAG 
GGCTTGGCTC TGATAAAGAA TGGGCTTAGA AGGTACCTCA ACACGGGCTT TCAAAACTGG 
ATAATCAGTT ACATAGGCTC AATAGGGGGT TACGCATTAA CATACCTAGT GTACCTATCC 
CTAGGCCCTG AGTACGTGGC TATATACAAC CTAGTAACAT ACATGCTCGG CGCAGTAACA 
ACATTAACTG GTTCAGTGAG TAACGTATTC AGTAGTAAAC TTTCACACGT GATAGGCGCC 
GGCGGTGATA CAAAGGCCTT AGTAAGGGAT TATGCAATCT CCATTATAGT GACCAGCGGC 
GTACTATCGC AGTTAGCCAT GTTAACCATC CCACTGCTTC CTATCCTGAG TATTGTGCAT 
GGTGATTACG TGAGATCCAT ACCCTATGCG ATGTTGTTAC TAGCCTCAGC GGTGATTTCG 
GCACCCGTGA GTATATACAC AGTGTATTAC TGGGTCCTTG GTAAGGGTTG GCATTCAGTT 
AAGATCTCAG CATTGGGGGT TACCGTGGGT CTTTTAATAT TCATAATCAC TGTTAAGTAC 
CTGGGCTTCT ACTCAGTAAT CCTTTCATCA TACGCATCCT CAATCTCCCC ATTAATCGCA 
TTCATATAA

Protein sequence

MSSESSVSGV ITGYLASAVI YVIILTRLIP LTQYGYYNSL LAMMGIFSLF FPTLGIDVAI 
AREAAMLHAR DMPFEGHMAA ILLISIILTT AYSLTLFLAI PLYIISKIPS YYLGIVYIYI 
AWIITQAFTG VLSTYLWIMS KLRSQGVGNM LYSLVFRPLE VALLVVMHSV YAIIISILIG 
QLTALLYYML IIRRLPNPLK GLALIKNGLR RYLNTGFQNW IISYIGSIGG YALTYLVYLS 
LGPEYVAIYN LVTYMLGAVT TLTGSVSNVF SSKLSHVIGA GGDTKALVRD YAISIIVTSG 
VLSQLAMLTI PLLPILSIVH GDYVRSIPYA MLLLASAVIS APVSIYTVYY WVLGKGWHSV 
KISALGVTVG LLIFIITVKY LGFYSVILSS YASSISPLIA FI