Gene CA2559_12043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_12043
Symbol
ID	9297898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	2618105
End bp	2619748
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	34%
IMG OID
Product	sodium iodide symporter
Protein accession	YP_003717150
Protein GI	298208971
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.48339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTTACG GTGCCTATAA AACTAAGGGT AGTAAGAATG TACAAGATTA TATAAAAGGT 
AATAATGAAG CACAATGGTG GACCATAGGT TTATCTGTCA TGGCTACACA AGCAAGTGCC 
ATCACATTTT TATCTACACC AGGACAAGCC TTTCATAGCG GTATGGGTTT CGTTCAATTT 
TATTTTGGTT TACCTATCGC CATGGTAATT ATTTGCTTGG TGTTTATTCC TATTTACCAT 
CGCTTAAAGG TATACACGGC TTATGAATAT TTAGAAAGTA GGTTTGATCA AAAAACCAGA 
ACGCTTACAG CAATACTATT TCTTGTACAG CGTGGTTTAG CAGCAGGTAT AACCATATTT 
GCTCCTGCAA TAATTTTATC TGCAGTATTA GGTTGGGATT TACTCACGCT TAATATTATT 
ATTGGTGTTC TTGTTATTAT TTATACTGTA TCTGGTGGAA CTAAAGCTGT AAGTATTACA 
CAAAAACAGC AAATGGCCGT AATCTTTGCA GGTATGTTTG CTGCCTTCTT TATTATTGTA 
AGCAAACTAC CAGAAGATAT TACTTTTACT AAAGCCTTAG ATATTGCTGG TGCAAGTGGA 
AAAATGGAGA TCCTCGATTT TTCTTTTGAT CTTAGTAATA GATATACTAT TTGGACAGGA 
TTTTTAGGAG GTACCTTTTT AATGTTATCT TATTTTGGGA CAGACCAAAG CCAAGTACAG 
CGATATTTGT CTGGTCGATC TGTTCGTGAA AGCCAATTAG GACTATTATT TAATGGTCTT 
CTTAAAGTAC CAATGCAATT CTTTATTCTA TTGGTTGGTG TTATGGTATT TGTGTTTTAT 
CAATTTAACG CATCTCCTAT AAACTTTAAT CCAGCTGCTC ATGAAGCTGT TCAGAATTCT 
GAATATGTAC AAGAATACAC TGCACTTGAA AATCAATTAA AAACAATTCA AGCAGAACAG 
AATATTACCA GTTTGGCGTA TGCAGAAGTT TCAGATCAAA CTAGTTCAGA AGACTACAAG 
GCGTTAAAAT CTCAATTGGC TCAATTAAAC AAAGAAGAAG TTGCCGTACG CGAAAAAGCA 
AAAACAATAA TCACGAGTGC AGACGCTACA ATTGAAACTA ATGACAAGGA TTATGTTTTT 
ATAAATTTTA TACTAAACAA TCTTCCAAGA GGTCTTATAG GCTTGCTTTT GGCTGTAATT 
TTATCTGCTG CTATGAGTAG CACGGCATCA GAATTAAATG CATTGGCATC TACCACAGCT 
ATGGATTTGT ATAAGCGTAA CGTTACTACA GAAAAAAATG ACATGCATTT TGTGAAAGCC 
TCTAAATGGT TCACATTAGG TTGGGGAGTT TTAGCCATAT TAGTGGCTTG TGTCGCAAAT 
TTATTTGACA ATCTTATACA GCTCGTAAAT ATTATAGGTT CAATATTTTA TGGAAATATT 
CTTGGTATCT TCCTACTTGC CTTTTTTGTA AAGTATGTAA AAAGCAAGGC AACATTTGTA 
GCTGCCATAC TTACACAAGC AATTATTGTG TTTGTTTGGT ATATGGATTA CCTGCCTTAC 
CTATGGCTTA ATGTTTTGGG TTGTGGTATT GTAATGGCAA TTGCTATCCT ATTGCAAACA 
ACTTTTAAAG CTAAAGAACA TTAA

Protein sequence

MAYGAYKTKG SKNVQDYIKG NNEAQWWTIG LSVMATQASA ITFLSTPGQA FHSGMGFVQF 
YFGLPIAMVI ICLVFIPIYH RLKVYTAYEY LESRFDQKTR TLTAILFLVQ RGLAAGITIF 
APAIILSAVL GWDLLTLNII IGVLVIIYTV SGGTKAVSIT QKQQMAVIFA GMFAAFFIIV 
SKLPEDITFT KALDIAGASG KMEILDFSFD LSNRYTIWTG FLGGTFLMLS YFGTDQSQVQ 
RYLSGRSVRE SQLGLLFNGL LKVPMQFFIL LVGVMVFVFY QFNASPINFN PAAHEAVQNS 
EYVQEYTALE NQLKTIQAEQ NITSLAYAEV SDQTSSEDYK ALKSQLAQLN KEEVAVREKA 
KTIITSADAT IETNDKDYVF INFILNNLPR GLIGLLLAVI LSAAMSSTAS ELNALASTTA 
MDLYKRNVTT EKNDMHFVKA SKWFTLGWGV LAILVACVAN LFDNLIQLVN IIGSIFYGNI 
LGIFLLAFFV KYVKSKATFV AAILTQAIIV FVWYMDYLPY LWLNVLGCGI VMAIAILLQT 
TFKAKEH