Gene Noc_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1010
Symbol
ID	3707271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1117373
End bp	1118662
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	55%
IMG OID	637737515
Product	major facilitator transporter
Protein accession	YP_343048
Protein GI	77164523
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAT CTGGCCATCA TTCAACGCCC GCTTCTAAAG CAAGCCTTAT CTCCTGGGCT 
TTATACGATT GGGCCAATAG CGCCTTTGCC GCCGTTATCA CCACCTTTGT GTTCGCCGCC 
TATTTTACCC GGCAAGTGGC GGAAAACGAG ACTCTTGGCA GCGCCCAATG GGGGAACATA 
GTGGGCATCT CCGGGCTTGT TATCGCCATT ACGGGACCGC TCCTGGGGGC CATTGCCGAC 
CAAGGGGGAC GCCGCAAGCC CTGGATTATC GTCTTCACCT TATTGTGCGT TATAGCCACG 
GCGCTTCTAT GGTTTATCAA ACCTACGCCT GACTATGCCT GGCTGGCACT GCTACTAGTT 
GGGCTAGGCA CCCTCGGCGC TGAATTTGCT TTCATCTTTT ACAATGCCAT GCTGCCCGGC 
TTGGCGGGAC CGAAATATGT AGGGCGGTGG TCCGGCTGGG GCTGGAGTAT CGGCTATGCA 
GGTGGCGTAG CCTGTCTAAT CGTCGCCCTC TTTGCCTTCA TCCAAGGGGG AAATCATTGG 
TTTGGCCTGG ACCCCGATTC CGCTGAGCCT GTGCGCGCTA CCTTTCCCCT GGTCTCCGGG 
TGGTACTTAC TGTTTGCCCT CCCCTTGTTT CTCATCACAC CCGATACCCA AGGCACCGGC 
AAACCCCTCT GGCGGGCAAC GAAAGATGGA ATGAGGCAGC TTTATGACTC CATTCGCCAT 
GTACGCCAGT ACAGCACTAT CGCTCGCTTC CTTATTGCAC GCATGTTTTA TATCGACGGT 
CTGGCAACTT TGTTTGCTTT TGGCGGTGTC TATGCGGCCG GAACCTTCGA CATGGACGAG 
CAAGAAATAC TCCTGTTTGG AATCGCCCTT AACGTCACTG CTGGCCTGGG AGCCGCGGCT 
TTTGCCTGGA TAGACGACTG GATAGGCAGC AAAAAGACCA TCCTGTTATC CCTGATTAGC 
TTGATTTTGC TGACCACCCT GATCCTGATC GTGGAAACCT CGACCCTCTT TTGGACCTTT 
GGACTCCTGC TCGGAATATT TGTGGGACCG GCCCAAGCCG CAAGCCGATC TTTTTTAGCA 
CGAGTGGCGC CAGAGTCCTT GCGCAATGAA ATGTTCGGCT TGTTTGCCCT TTCTGGCAAA 
GCGACCGCCT TCCTAGGTCC CTTATTGGTG GGCTGGATCA CTTACCTGGC GGGCAGCCAG 
CGAATTGGCA TGGGCGCTAT CGTCATTTTT CTTCTCGTTG GCTTTGTGCT AATGCTGACC 
GTCCCAGCCG CTAAAAAACC AGAAGAATAG

Protein sequence

MTQSGHHSTP ASKASLISWA LYDWANSAFA AVITTFVFAA YFTRQVAENE TLGSAQWGNI 
VGISGLVIAI TGPLLGAIAD QGGRRKPWII VFTLLCVIAT ALLWFIKPTP DYAWLALLLV 
GLGTLGAEFA FIFYNAMLPG LAGPKYVGRW SGWGWSIGYA GGVACLIVAL FAFIQGGNHW 
FGLDPDSAEP VRATFPLVSG WYLLFALPLF LITPDTQGTG KPLWRATKDG MRQLYDSIRH 
VRQYSTIARF LIARMFYIDG LATLFAFGGV YAAGTFDMDE QEILLFGIAL NVTAGLGAAA 
FAWIDDWIGS KKTILLSLIS LILLTTLILI VETSTLFWTF GLLLGIFVGP AQAASRSFLA 
RVAPESLRNE MFGLFALSGK ATAFLGPLLV GWITYLAGSQ RIGMGAIVIF LLVGFVLMLT 
VPAAKKPEE