Gene Cmaq_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1389
Symbol
ID	5709423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1465402
End bp	1466994
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	48%
IMG OID	641275900
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_001541205
Protein GI	159041953
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG1953] Cytosine/uracil/thiamine/allantoin permeases
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.461228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGGAAA CAATAAACTC CCAGTCAACG GTGGTTTACA ATAGAGAGAG GGGTCAATTA 
GAGTTAAAGG TCTCATACCC TGAGGAGAAG TACCTATGGA ACAGTGACCT TCACCCAACG 
CCAATACGTA AGAGGACCTG GGGCTGGTAC ACTTATGCAG CAATATGGTT CAGCATGGCC 
TTCATAGTGC CAAGTTGGTC ACTGGCAAGC CTCGGCTTAT CCTTTGGCCT AGGGGCGGTG 
GAGTCAATAC TAGTCGTCTT CCTAGGCAAC CTAATAGTCC TAGTACCAAT GATAATTCAA 
TCCCACGGTG GCGCAAGGTA CGGTATACCT GAACCAGTTT TAACTAGGAC TAGGTGGGGT 
GTCTACGGGG CTGTTTTCCC CAGTTGGATA AGGGCTGTGA TCGGTGCCGG ATGGTGGGGT 
ATTGAGTCAT ACATTATGAC TGAGGCCGCA GTAGGCATTT ACGCGGTCTT AAGCGGTAAA 
CTACCGGTTA TTGAGTCCCT TGTGGCTAAG GGTGTTGCGT CACCATTCAC AATAAGTATA 
GCCTTCCCTC AAGTCTTCTG GGTAACCTTC ATTGCAATAA TAATTCTTCA ACTAATCCTA 
CTATACCACT CCCCAGTGCC TAATGCTCAA CCAGCCTTAA AGTGGTTTGC AAGGCTCTCG 
GCACCGTTAA TACTGGCCGG CTTCCTTGCA CTATGGCTAC ACTTCATGTC AGCATCAGGT 
TGGAATTACG GTAACATATT CTCAATACAC AGTAGCCTAA GGGGCTCAGC CTACTGGCTG 
GCTTGGTTAG CCTTCCTAAA CGCAAACATA GCCTACTGGG CAACCATGGC CCTATCAATG 
CCTGATTACA CCAGGTTCGC TAAGAGCCAG GTGGCTCAAA TGATTGGGCA GGTCCCAATG 
CCATTCATGA TGCTTACAGT GGCTGTACTG GGCACCATGA CCACTGGGGC TGTTATGAGG 
CTTACTGGTC AACCAATATG GGATCCAATA CTCCTATCAA CACTCTACAT GGGGCCCATT 
GCCGGCGTGG TGGTTAATCT ACTATTCCTC CTAGCCACCT TCGCTGTTAA CGTATTCGCC 
AACACCGTTG GACCAGCCTA TGACTTCGCC AATACCTTAC CCAGGTACAT AACCTGGTTC 
AGGGGTGTTT TAATAGTGGT TGCTGTTGCA GTGCTCCTAG GTGCATGGAC ATACTATGGC 
TCAGCCTACG GCTACCTATA CAATTGGCTA CTAACCTACG GTGGATTATT AGGCTCAGTG 
GAGGGTATTA TAATATTTGA TTACGCATTA ATAAGGAGGT TTAAGTTTGA GCTTCAGGAC 
GTCTTCCTAA GCCACGGTAG GTTCAGGTAC TGGAGGGGGA TTAACCCAGC GGCCTTCATA 
ACCTTCGCCG TGGTCACCTT CATAATATAC GCTCCAATAC CGTACCACAG TATCCTATTC 
AATAATGCAT GGGTACTGGC CTTCATATTA TCTGGGTTAA TATACACGCC ACTCATGGTT 
TACTGGATAA TACCCAAGTA TCAGCCTCAC TTAAAGGGAT CAATATGGAG GGGAGGTTAC 
GTATCCAGTG AGGTTAAGGA ATTATTCAGT TAA

Protein sequence

MGETINSQST VVYNRERGQL ELKVSYPEEK YLWNSDLHPT PIRKRTWGWY TYAAIWFSMA 
FIVPSWSLAS LGLSFGLGAV ESILVVFLGN LIVLVPMIIQ SHGGARYGIP EPVLTRTRWG 
VYGAVFPSWI RAVIGAGWWG IESYIMTEAA VGIYAVLSGK LPVIESLVAK GVASPFTISI 
AFPQVFWVTF IAIIILQLIL LYHSPVPNAQ PALKWFARLS APLILAGFLA LWLHFMSASG 
WNYGNIFSIH SSLRGSAYWL AWLAFLNANI AYWATMALSM PDYTRFAKSQ VAQMIGQVPM 
PFMMLTVAVL GTMTTGAVMR LTGQPIWDPI LLSTLYMGPI AGVVVNLLFL LATFAVNVFA 
NTVGPAYDFA NTLPRYITWF RGVLIVVAVA VLLGAWTYYG SAYGYLYNWL LTYGGLLGSV 
EGIIIFDYAL IRRFKFELQD VFLSHGRFRY WRGINPAAFI TFAVVTFIIY APIPYHSILF 
NNAWVLAFIL SGLIYTPLMV YWIIPKYQPH LKGSIWRGGY VSSEVKELFS