Gene Noc_1626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1626
Symbol
ID	3705690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1817219
End bp	1818868
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	48%
IMG OID	637738101
Product	sulphate transporter
Protein accession	YP_343630
Protein GI	77165105
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAGC ACATTGAAAC CCTTGAGGCT CCTAGAAAAG GCTTTGCCGG CTTGAAGGAA 
AATTTTGCTG CCGATTTAAG GGCGGGGCTA AGTATTTCTC TCATTGCCCT ACCCTTGAGT 
CTAGGGATCG CTTTAGCTTC TGGTTTTCCG GCTTTTGCCG GTCTTATCGC AGCCATTGTA 
GGCGGTATAC TTGTTTCCCG CATCAGTGGC TCTTATGTCA CCATTAATGG GCCGGCGGCC 
GGGCTAATTG TAGCCAATCT GGCGGCTATC CAAAGTCTCG GCCAAGGGGA TATCCACGCT 
GGTTATCTTT ACGCTATCGC CGCGGTCTTT GTAGCCGGCA TCATGGTTTT TATAATTGGT 
GCCGCCGGGG CAGGAAAACT CGTAGATGTC TCCCCCAGTT CGGTGATTCA TGGCATGTTA 
ACCTACATTG GGGTGGTTAT CATGGCCAAA ATGTTCTTTC CCATGATGGG GGTCATTCCT 
GAAGTCCATT CAATTCTAGG CTCTAATGTG GTTGGCACCA TAGCCGCTAT TCCTCAAGGT 
TTTACCAAAA TGCTGCCCCC TGTTGCCATC GTAGGGTTTG TTTCTTTGCT CATCATGGCT 
ATCCACCCGA TGATTAGAGT CAAATGGGTG CAATTAATTC CAAGCCCGGT ATGGGTACTG 
ATATTTGCTA TCCCCGCAGG CGTGCTTTTT GATCTGGAAA CCTTGCAGCA ACAACTCAAC 
CTTCCAGAAG GGAAAGAACT GCTGCTAGCC CTACCGGGCA ACCCCCTCGA TGCCGTTGCT 
TGGATCGGTG CGGTTACCCC GGATTTCGGT AAAATATTAA CCTGGGCTTT TTGGTACGCC 
GCTCTCACCA TCGCCCTTAT CACGGCCATT GAATCCGGTC TTAGCGCCAA AGCGGTGGAT 
CAATTAGATC CTTATCAACG GCACTCAGAT ATCGGCAAAG ATATCCGGGG AGTGGGTATA 
GGCAGCGCCG TTTCCGGTAT TCTCGGCGGC TTGCCCATGA TCGCTGAAAT TGTCCGCAGC 
AAAGCCAATG TCCTGATGGG GGCAAGAACC GGTTGGGCCA ATTTCTTTCA TGGAACCTTT 
ATCCTGATTT TTGTTTTTGC ATTGTCCCCA GTCATGCAAA TGATTCCTGT TGCAGCACTG 
GCAGCTATGA TGGTATTCGT GGGATATAAA CTTGCTGCTC CCGGCGAGTT CATTGGTATC 
TTTAAAATTG GCCGGGATCA ATTTCTCTAT TTCATATTCA CCTTGCTTGT TTGTATCTTC 
ACTAATCTGC TTGTCGGTGT TTTCGCTGGT ATTATTTTCA AATTCCTCTA CCAATTGCTC 
GTGATGAGAG CGCCAACGTC TACTCTTTTC AAAGCAGATT TAACGGTAGA TCAAAGTGAT 
GAGGGTAAGG ATGAATACCG GGTTAAAGTG AGAAAAGGAG CAACCTTTAC TAACTTTCTT 
TCTTTTAAAC GCCGGTTAAG CCAACTACCA AAGGGCAAGA AAATCACGGT TGATTTCTCC 
GAAGCTAAAG TAGCGGATTT CACCTTTCAA AGCGCGCTAC ACCATTATGC TAAACTCTAT 
CAGGCAACTG GAGGATCAAT AGAACTAACT GGGCTCGATC AGCTTAAAGC CTACTCCAAC 
CATCCTCAAT CAACTCGCTA TCGGCGTTAG

Protein sequence

MAQHIETLEA PRKGFAGLKE NFAADLRAGL SISLIALPLS LGIALASGFP AFAGLIAAIV 
GGILVSRISG SYVTINGPAA GLIVANLAAI QSLGQGDIHA GYLYAIAAVF VAGIMVFIIG 
AAGAGKLVDV SPSSVIHGML TYIGVVIMAK MFFPMMGVIP EVHSILGSNV VGTIAAIPQG 
FTKMLPPVAI VGFVSLLIMA IHPMIRVKWV QLIPSPVWVL IFAIPAGVLF DLETLQQQLN 
LPEGKELLLA LPGNPLDAVA WIGAVTPDFG KILTWAFWYA ALTIALITAI ESGLSAKAVD 
QLDPYQRHSD IGKDIRGVGI GSAVSGILGG LPMIAEIVRS KANVLMGART GWANFFHGTF 
ILIFVFALSP VMQMIPVAAL AAMMVFVGYK LAAPGEFIGI FKIGRDQFLY FIFTLLVCIF 
TNLLVGVFAG IIFKFLYQLL VMRAPTSTLF KADLTVDQSD EGKDEYRVKV RKGATFTNFL 
SFKRRLSQLP KGKKITVDFS EAKVADFTFQ SALHHYAKLY QATGGSIELT GLDQLKAYSN 
HPQSTRYRR