Gene Noc_1365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1365
Symbol
ID	3706129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1512219
End bp	1513253
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	51%
IMG OID	637737860
Product	solute/sodium symporter
Protein accession	YP_343389
Protein GI	77164864
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID	[TIGR00841] bile acid transporter

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAA CAGCTAATCG AATCACAGCT CTATTTCCAC TGCTGGCGCT CATGGGGGCT 
GGAGTGGCCT ACCAATATCC TGAACCCTGG GTAGTTCTCA AACCGGCTAT CGTACCCCTG 
TTAGGTGTGA TCATGTTTGG CATGGGAATA ACTCTTAAAG CCAATGATTT CGTCCTAATT 
CTCAAACAGC CCCAAGCTGT TGCGACGGGC GCCCTGTTAC AGTTTTTATT GATGCCTTTC 
ATCGCCTGGA TAGTAAGCCA CCTTTTTAGC TTACCGGCAT ATCTTACCGT CGGCATGATT 
CTGCTGGGAT GCAGCCCAGG AGGCACCGCC TCCAATGTGG TGTGTTATCT AGCCCGGGGT 
GATGTGGCCC TCTCCATCAC CCTAACGGCT GCTTCCACGC TTCTATCGGT TCTTGCCACT 
CCTTTTCTCA CCTGGCTTTA TGTGGGGCAG CAAGTCCCAG TGCCAGTAGC TGATATGCTG 
CAAAGTATTT TGATAATCGT GCTGCTTCCT GTCACCTTGG GAGTTATCAT CAATACTTTT 
TTCGGCCAAC GGCTAGGCAA GCTCACCGAT GTTTTTCCTG TCATTTCGGT CTTTGCCATT 
GTGCTCATCG TGGCGATTAT CGTGGCCATT AACCAGGATA AACTGACCCT CATTGCTCCA 
ACAATCGCCC TCTGCATCCT GTTACATAAT GGATTGGGCC TGGCAAGCGG TTATGGATTA 
GCCCAGACCC TAGGTTTTAG TCAACGCCAA TCCCGCACCG TAGCCATTGA GGTAGGCATG 
CAGAACTCAG GTCTAGCGGT GGCCCTGGCC TTAAAATACT TTACCGCCCA GGCCGCCCTT 
CCCGGAGCTT TATTTAGTAT CTGGCACAAT CTCTCCGGGT CCCTGCTGGC TTACTACTGG 
TCACACCGTT CCCAAGACTC CCCAGGGGAA CGATTAAAAG CCGACGCTCA TCCAGTCTGG 
AAAAAGGCTT CCACCTCTTT AATATCCTGG CTTTGGGCTA TGCTTGGCAG GCTCTTCAGG 
AACAAACGAC CATAG

Protein sequence

MATTANRITA LFPLLALMGA GVAYQYPEPW VVLKPAIVPL LGVIMFGMGI TLKANDFVLI 
LKQPQAVATG ALLQFLLMPF IAWIVSHLFS LPAYLTVGMI LLGCSPGGTA SNVVCYLARG 
DVALSITLTA ASTLLSVLAT PFLTWLYVGQ QVPVPVADML QSILIIVLLP VTLGVIINTF 
FGQRLGKLTD VFPVISVFAI VLIVAIIVAI NQDKLTLIAP TIALCILLHN GLGLASGYGL 
AQTLGFSQRQ SRTVAIEVGM QNSGLAVALA LKYFTAQAAL PGALFSIWHN LSGSLLAYYW 
SHRSQDSPGE RLKADAHPVW KKASTSLISW LWAMLGRLFR NKRP