Gene Noc_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1687
Symbol
ID	3705600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1888053
End bp	1889726
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	49%
IMG OID	637738168
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_343689
Protein GI	77165164
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00296418
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAGT ATGTTTATAG TATGAACCGG GTGGGCAAGG TAGTGCCGCC GAAACGCGTT 
ATTTTGCGCG ATATCTCCCT ATCCTTTTTT CCAGGTGCAA AGATTGGCGT GCTAGGTCTG 
AATGGGGCAG GAAAATCAAC CGTGCTCAAA ATTATGGCCG GAATTGACAA AGATATTGAA 
GGCGAAGCTA TTCCCCAAAA AGGACTTAAG ATCGGCTACC TTTCTCAAGA GCCGCATCTG 
GATCCTGCTA AAAATGTCCG GGATAACGTG GAGGAGGGAA TTGCCGAAAC TAAAGCTATG 
TTGGAGCGAT TCAACGAGAT TGGCCTGTTA TTTGCCGAGC CAATGAGTGA TGAAGAAATG 
AATCGCCTCT TTGAGGAACA GGCACAGCTT CAAGACGCTA TTGAAGCTGC GGATGCCTGG 
AATCTAGATC ATAAGCTTGA TATCGCTGCC GAAGCGTTGC GCCTCCCTCC TTGGGAGGCA 
GAGGTCACCC ATCTTTCGGG CGGGGAACAG CGGCGTGTGT CCCTTTGCCG CTTGCTCCTT 
TCTGAGCCAG ATATGTTGCT GCTAGACGAA CCTACTAATC ATCTTGATGC AGAGTCGGTT 
GCTTGGTTGG AGCGCTACTT GGAAAAATAT CCGGGTACTG TCGTAGCTGT AACCCATGAT 
CGCTATTTCT TGGATAATGT GGCCGGCTGG ATTCTGGAAT TAGATCGCGG CCACGGTATT 
CCTTGGGAGG GAAATTACTC ATCTTGGCTG GAACAAAAAG AAAAACGCTT GCAATTAGAG 
GAGAAGCAGG AGGGGGCCCG GATTAAAGCA ATAAAGGCGG AGCTCGAATG GGTTTCCGTA 
AACCCAAAAG GGCGGCATGC CAAGAGCAAA GCCCGTCTCG CCCGTTTTGA AGAATTATCT 
TCCCAAGAAT ACCAAAAACG CAACGAAACT AATGAAATCT ATATTCCACC AGGTCCACGT 
CTGGGGGATA TAGTGATTGA AGCAAAGGAT CTGCGCAAGA GCTTTGGTGA CCGTTTACTT 
ATTGATGAGC TAAATTTCAG CCTTCCTCCT GGGGGGATTG TGGGAATCAT CGGTGCCAAT 
GGCGCGGGAA AAACAACTTT GTTTAGAATG ATGGTGGGCC AAGAGCAGCC GGATGCGGGT 
GAAATTCGAC TAGGGGATAC AGTCAAGTTG GCTTATGTCG ATCAAGGCCG GGAGGCTTTA 
AATGCTAGCA AAACCGTGTG GGAAGAGATT TCAGAAGGTC AAGACATTAT CAAGGTTGGG 
GCTTATGAGA CTCCTTCCCG CGCCTACGTA GCGCGATTTA ATTTTAAAGG TTCAGATCAG 
CAAAAACGTA TTGGAGATCT TTCTGGCGGT GAGCGTAATC GGGTGCATCT AGCTAAGTTG 
CTTCGTGCTG GAGGAAATGT TCTTCTCCTT GATGAACCGA CCAATGACTT AGATGTGGAA 
ACCCTAAGAG CCTTGGAGCA GGCTCTACTA GGTTTCCCCG GCTGTGCCGT AGTGATTTCC 
CATGATCGTT GGTTTTTAGA TCGTATTGCT ACCCATATTC TCGCTTTTGA AGGGGATAGC 
CAAGTTATTT GGTTCGAAGG CAACCATGCC GATTATGAAG CGAACCGTCG CCAGCGCCTG 
GGTGAGATGG CCGATCAGCC TCATCGTATC CGTTACCAAC CCTTGTTTTC ATAG

Protein sequence

MAQYVYSMNR VGKVVPPKRV ILRDISLSFF PGAKIGVLGL NGAGKSTVLK IMAGIDKDIE 
GEAIPQKGLK IGYLSQEPHL DPAKNVRDNV EEGIAETKAM LERFNEIGLL FAEPMSDEEM 
NRLFEEQAQL QDAIEAADAW NLDHKLDIAA EALRLPPWEA EVTHLSGGEQ RRVSLCRLLL 
SEPDMLLLDE PTNHLDAESV AWLERYLEKY PGTVVAVTHD RYFLDNVAGW ILELDRGHGI 
PWEGNYSSWL EQKEKRLQLE EKQEGARIKA IKAELEWVSV NPKGRHAKSK ARLARFEELS 
SQEYQKRNET NEIYIPPGPR LGDIVIEAKD LRKSFGDRLL IDELNFSLPP GGIVGIIGAN 
GAGKTTLFRM MVGQEQPDAG EIRLGDTVKL AYVDQGREAL NASKTVWEEI SEGQDIIKVG 
AYETPSRAYV ARFNFKGSDQ QKRIGDLSGG ERNRVHLAKL LRAGGNVLLL DEPTNDLDVE 
TLRALEQALL GFPGCAVVIS HDRWFLDRIA THILAFEGDS QVIWFEGNHA DYEANRRQRL 
GEMADQPHRI RYQPLFS