Gene Cmaq_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1249
Symbol
ID	5708951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1319459
End bp	1320559
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	41%
IMG OID	641275754
Product	major facilitator transporter
Protein accession	YP_001541066
Protein GI	159041814
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.000314091
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCATAGGA ACGTTTACTT AATCTTACTC ATTAAGGGAC TGAGAACCTT CGTCTTCGGT 
ATTGTTAGTG TACTGACACC CATTTACTTA GCCATGTTGG GTTTCCCACC CATTTATGTG 
GGTGCCTCTT TATTCCTTAT GGTTCTCGGC AATGTTCTCT CAAACATATT ATTAACCTGG 
TTTGGTGACG TAATTGGTAG GAGAAGATTA TTAATCATCC TTAGTTTATT CATGTTTATT 
TCAGGCATAT TATTGTTCTC ATCCTCATTA TACCCAGTAA TGGCATTAGC ACTACTTATA 
GGTAACATAA GCACCACAGG AACTGAGGCT GGTCCCTTTC AATCAATTGA AACAGGCGTG 
TTACCTAGGT TTACTGGTGA TAGGCTAGGT AGGATCCTAG GTGTTTACAA TCTCATTGGT 
TACTCCGCTT CATCAATTGG CGCCCTTGCG TCATCATTAC CAGCCTACCT TGGGAATAAC 
ATACATGTAA TTAGGTCAAT GTACCTAATT TATGCCCTTG CTGGTTTAAT AATGATTATT 
GTTTATAACA CATTAAGTGG TATTGAGACC ACTAGGAGGG ATTTAGGGTT GAGGGGGTTA 
AGTAGGTCTG CGGTCGCTGA TATTAGGAAT CTATCAATAT TATTCTCAAT AGATGCATTC 
GGCGGTGGGT TGGTGACGCA GTCATTATTA TCATACTGGT TCTATATTCG TTATGGCGTA 
TCCTTGAGGG AATTAGGTGT TGTATTCATG ATTGTTAACG TGGTTACAGC ATTATCGTTA 
ATTATTGCAC CATTAATAGC TGAGAGGATT GGTAATTTAA GAACAATGGT GTATACGCAT 
ATAGTATCAA ATGTCTTCCT AATATTAGTG CCGTTGGCTG GAACATTCCT GGGAAGCTTC 
ATATTCCTCC TATTGAGGCA GAGTGTCTCT CAAATGGATG TACCGACTCG GCAAGCGTTT 
ATGGTGCAGA TATTTAAGGA TGAGGAAAGA GTCGCCGCTA ACGCCATAAC CAACACTGCA 
AGGAGCATAA GCACCTTACC TGGATCATTA ATAGTTGGTG ATAAAAGAGG TGGCAAACTT 
CGCCTTTTCA AGGCGGGGTA G

Protein sequence

MHRNVYLILL IKGLRTFVFG IVSVLTPIYL AMLGFPPIYV GASLFLMVLG NVLSNILLTW 
FGDVIGRRRL LIILSLFMFI SGILLFSSSL YPVMALALLI GNISTTGTEA GPFQSIETGV 
LPRFTGDRLG RILGVYNLIG YSASSIGALA SSLPAYLGNN IHVIRSMYLI YALAGLIMII 
VYNTLSGIET TRRDLGLRGL SRSAVADIRN LSILFSIDAF GGGLVTQSLL SYWFYIRYGV 
SLRELGVVFM IVNVVTALSL IIAPLIAERI GNLRTMVYTH IVSNVFLILV PLAGTFLGSF 
IFLLLRQSVS QMDVPTRQAF MVQIFKDEER VAANAITNTA RSISTLPGSL IVGDKRGGKL 
RLFKAG