Gene Noc_1600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1600
Symbol
ID	3705762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1779335
End bp	1780756
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	55%
IMG OID	637738076
Product	Na+/solute symporter
Protein accession	YP_343605
Protein GI	77165080
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0101485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCATCG TCCTCAATTT TTTATTCTTT TTAGCGATTT TTGCGGGAGT TGGTTTGTTG 
TCGGCACGCA AGTCCCAAGG CACCCGCCAT GATTACTATA TGGCCAACAA TTCGGTAAAA 
CCTTGGCTAG TGGGTTTATC GGCGGTCGCC ACTAACAACA GCGGCTACAT GTTTATCGGG 
GTTATCGGTT ACACCTATCT GACCGGTTTG GCGTCGCTAT GGCTGGTGAT CGGCTGGATT 
CTGGGGGACT TTATCGCCTC CCAATTGGTG CATCGGCATC TGCGGGAAGC CACGGTTCGC 
ACCGGCGAGG TCACCTATGG GGGCGTGCTG AGTCAGTGGT ATGGCGCCGA ATTGGCGGGA 
CTGCGGCGAA TAGCAGGCCT TCTCACGGTC ATTTTTCTGG GTATCTACGC GGCAGCTCAG 
CTAAATGCTG GCAGTAAGGC CCTGCATGTA TTATTCGACT GGCCTTTCTA CGCGGGCGCA 
GTGATCGGCG CGGTGCTAGT AGTGGGTTAT TGCTTTGCCG GCGGCATCCG TGCTTCCATC 
TGGACGGATG CCGCCCAATC CTTTGTCATG TTCGGCGCCA TGCTGACCTT GCTTTACGCG 
GCCGTCATGG CTTTGGGGGG CCCGCAAGGC GCCTGGGGAG AAATGGGTAA AATCAAAGGC 
TTTCTGGACT GGTCCCCCGC AGATACGCTG ATTCCAGGGA TGGCGGGGCT TGCCTTTTTT 
GCTCTGGGCT GGTTTTTTGG TGGTTTTTCC GTGGTGGGCC AGCCCCACAT CATGATCCGT 
TTTATGGCCC TGGATAATCC TAGCCATATG GCCCGGGCGC GGCTCTATTA TTATCTCTGG 
TATACCCTAT TCTACCTGTT GGCCACAGGC GTGGGCATGC TCTCCCGGGT GTATTTACCA 
GAAGCACAGA ACTTTGACCC GGAACTGGCC CTGCCCACCA TGGCCCTGCA ACTATTACCT 
GATATGCTGG TAGGATTGAT CCTGGCCGGT ATTTTTGCAG CCACCATGTC CACGGCGGAT 
TCCTTGATAT TATCTTGTTC AGCGGCCCTT ACCCATGATT TACTGCCCCA CCAATTTGAG 
AATATGGGCA AGATAAAGCT GGCCACGGTC GTGGTAACGG CCCTAGCCTT AGCCATTGCT 
TTGAGCAGCA ACGAAAGCGT GTTTACGTTG GTGATTTTGT CTCTCTCCTT CCTGGCATCA 
GCTTTTGTGC CTTTATTATT GATTTACACT CTCGGCGGCC AGCCCACGGA CCGGCAGGCC 
TTAATCATTT TAGGAGCGGG CCTCGGCGTG GCCATAGTCT GGCGCTGGCT GGGCTTCCAT 
CACGCCCTCT ACGAAGGGAT GCCCGGCATT CTGGCGGGCC TACTGGCTTT TGGCATGCTG 
CGACTGTTCG GAAAAGTCGC TAGAAGCTTG GTAAGATCAT AG

Protein sequence

MIIVLNFLFF LAIFAGVGLL SARKSQGTRH DYYMANNSVK PWLVGLSAVA TNNSGYMFIG 
VIGYTYLTGL ASLWLVIGWI LGDFIASQLV HRHLREATVR TGEVTYGGVL SQWYGAELAG 
LRRIAGLLTV IFLGIYAAAQ LNAGSKALHV LFDWPFYAGA VIGAVLVVGY CFAGGIRASI 
WTDAAQSFVM FGAMLTLLYA AVMALGGPQG AWGEMGKIKG FLDWSPADTL IPGMAGLAFF 
ALGWFFGGFS VVGQPHIMIR FMALDNPSHM ARARLYYYLW YTLFYLLATG VGMLSRVYLP 
EAQNFDPELA LPTMALQLLP DMLVGLILAG IFAATMSTAD SLILSCSAAL THDLLPHQFE 
NMGKIKLATV VVTALALAIA LSSNESVFTL VILSLSFLAS AFVPLLLIYT LGGQPTDRQA 
LIILGAGLGV AIVWRWLGFH HALYEGMPGI LAGLLAFGML RLFGKVARSL VRS