Gene CPS_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4056
Symbol
ID	3521694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	4267261
End bp	4268808
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	47%
IMG OID	637286500
Product	NCS1 nucleoside transporter
Protein accession	YP_270712
Protein GI	71281223
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG1953] Cytosine/uracil/thiamine/allantoin permeases
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATGA GCAACAGTAA TTTAAATTCT TCGTCAGTCG TTCAGGTTGG CGAATTTTAT 
GAGCTAGAAG TGGGCAAAGA TGTCCAGGAT AGTGATCACT ATAATGAAGA TATGGCCCCG 
ACGAGTGTGA AAGACAGGAC TTGGAATACC TGGAATGTCG CGGCGTTGTG GGTGGGCATG 
GCAATTTGTG TGCCGACCTA TACCCTAGGG GGGGTCTTGA CGGCTTATTT CGGTTTGAGT 
GTAACTGAAG CGCTGATCAC CATATTACTG GCAAATATCG TAGTATTGAT TCCCTTGACC 
CTTAATGCGT ATCCTGGTAC AAAATATGGC ATTCCTTTCC CGGTATTATT ACGTTCTTCC 
TTTGGTATCA AAGGCTCCAA TATTCCCTGT ATGATCCGAG CGCTAGTCGC CTGTGGCTGG 
TTTGGGATCC AAACCATGTT TGGCGGCGTC GCTATTCATA TTTTGATGTC AAATCTGTTT 
GAGTCCTGGG CGACCTTGGG AGGAACGGGT GAGGTTTTTG GCTTCTTTAC TTTTCTCGCT 
ATTAACCTGT TTATCGTTAT CAAGGGCTCC GAATCAATTA AGATCCTTGA AACCGTTGCC 
GCACCGCTGT TGCTTGCGGT AGGTATTGGT CTGATGATGT GGGCCTATCC ACAGATCTCT 
GTGACTGAAA TTCTAGCCAC ACCCGCTAAC CGTCCTGAAG GTGCATCATT CTGGGGTTAC 
TTCTTTGGCG GGTTAACTGC GATGGTTGGT TTTTGGGCAA CCTTGTCGCT GAACATTCCG 
GATTTTAGTC GTTATGTTAA GTCACAGAAA TCACAAATCG CAGGCCAAAT CATAGGCCTG 
CCAGCTACCA TGTTCTTCTT TTCCGCTTTA GGGGTAGTCT TGACTGCCGC TTCAACGACC 
TTGGTTGGTG AAACTATCTC TGATCCAATT AACCTTATTG GCAAAATCGA CAGCCCAGTA 
TGGGTGGTGA TTGCAATGGT GATGATTATT ATCGCGACGC TGTCGACTAA TACTGCCGCC 
AATGTTGTGT CACCTACCAA TGATTTTCAG AACCTAGCAC CCAAGAAGAT TAGTCAAACA 
CGCGGTGTAT TACTGACTGG TCTGCTGGGT GTGTTACTGA TGAGCTGGGA GCTGCTTAAA 
AAACTGGGTT GGATTGAGTC TGATGTTAGT GTTGAAGCCA TGTACACCGG CTGGTTATTG 
GGCTACTCCA GTTTGCTGGG GCCGATAGCC GGGATCATGG TGGTCGATTA CTTTATTATC 
AAAAAACAGC GTCTGGAATT GGCAGAGCTC TATAAATCAG AGGGTATTTA CGGTGGCTTC 
AATAAAGCTG GACTGCTTGC TTTCGGAATC CCTGTCACCT TGACGCTCAT TGCGATAACT 
ACAGGCATGT TCTCCTGGTT TTATCAATTC GGTTGGTTCA CTGGGTCTAT TATGGGTGGT 
GTGGTGTATT TCATCGCCGC CAGCAAACAG CAAGCAGAAA GTAGTGTTGG GATCCAGCAA 
ACAGCGTCGG ATGCCAGCGA ACTGAAAAGC CTGAGAAACA ACGCATAA

Protein sequence

MKMSNSNLNS SSVVQVGEFY ELEVGKDVQD SDHYNEDMAP TSVKDRTWNT WNVAALWVGM 
AICVPTYTLG GVLTAYFGLS VTEALITILL ANIVVLIPLT LNAYPGTKYG IPFPVLLRSS 
FGIKGSNIPC MIRALVACGW FGIQTMFGGV AIHILMSNLF ESWATLGGTG EVFGFFTFLA 
INLFIVIKGS ESIKILETVA APLLLAVGIG LMMWAYPQIS VTEILATPAN RPEGASFWGY 
FFGGLTAMVG FWATLSLNIP DFSRYVKSQK SQIAGQIIGL PATMFFFSAL GVVLTAASTT 
LVGETISDPI NLIGKIDSPV WVVIAMVMII IATLSTNTAA NVVSPTNDFQ NLAPKKISQT 
RGVLLTGLLG VLLMSWELLK KLGWIESDVS VEAMYTGWLL GYSSLLGPIA GIMVVDYFII 
KKQRLELAEL YKSEGIYGGF NKAGLLAFGI PVTLTLIAIT TGMFSWFYQF GWFTGSIMGG 
VVYFIAASKQ QAESSVGIQQ TASDASELKS LRNNA