Gene Noc_2752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2752
Symbol
ID	3705290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3123932
End bp	3125284
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	55%
IMG OID	637739230
Product	hypothetical protein
Protein accession	YP_344731
Protein GI	77166206
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00174638
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTGATAG ATGATTTAAC CCAGGCGCTT AGCGCCAGTG AAGGCTCATC CGCCGAGCAG 
TTGAAACAGC TCAAAGCCCA ACTGCTAGGC CATTGCCGAG CGCCTGTCAA GGTTACGGAT 
GAGGACGTTC CCCCTCTGCT TATTGCCGCG ATTAATTTTG CTTACGGCAA TCCCACTTCC 
CCAGAGCAGT TGCTAAGCGC GGAAAGCGCC AAGGCCGCGC TGACTGCCAA GGTAACCCCT 
AAAACTATTG GGGATATGTT TATTTGGGCC GCCTTGGCTT CCCATATGGG CACCCACCAT 
CCCAAGTCCC GCAACGACAA GGTCAGTTCC GGACCCATTG TGGCCCGTTC CTTAACACCG 
CCGCCAGCAG GCTTGGTGAC CTCGGCTAAC CTCAGAACGC GCCAATTCTC CGGCTCCGGT 
AATGGCGCCA ATACCGCCCA CTATCAATGG TTGGCGTTCA CCTATGAAGA CTCGGCCGGG 
GTATTCAGCG TGATTGAGCG CGCCGCTAGC CAGGATGAGC GTCTGGGCGA AACGGTGCTG 
ACTTTGGGCA TTCAGGAAAG TCAGTGGCAA GCCTTCCAGG AAGCGGCGGA GGCACATTTA 
ACGGTCACCA ATTCCGCGCC CTTGGATCGG CAATTAAAAC AAGTTTTTAT TCCTGATCCA 
GGCCAAAATA ACGATTTTAT CGTCATCACG CCCCTTGCCG CCACGGCGGT TATCGGCGCA 
TTTGAACAGC ATCGGACTAA ATTGCGGGAA CAAGACGCCA ACCTGAATTT TCACCGGATA 
GGTGTTGGTG GTGCTAAGCC GCAAAATGCC GGCAGCCTGA TGAATGAACT GGGCGGTAAT 
CTGCGGCAAT TAACCATGAC CATCCCCCGG CTTGATCTCA CCCAACGGCA GCGGCGGCTT 
TGGCATTTGC AGCGAGGGCG GCTGTTCCAG CCCCTGCCGA AAAAAGAGGC GCAGCGTTTT 
ACATGGTGGC TGGAGCTAGA TTGGACTCAG CGCTACGGTA ATCGGCAAGA CCATCTCCAG 
CGCCTTGAAC AGCGGATCGC TGAATGGCTA TTGCCGGAGC TTGAGGTGCA GGAACAGCTT 
TTTGCTTGGC TATCATCCGA TTCCCTAGAT GCTGTTCATG AGCGCCAAAA ACTTGAAGCC 
GAGAATCTGC CCAACTGGAT TTTAACTTTG GCGGGGATCA GTAAAAATCC GGAAACGGAG 
CACGGCACTC ACGAAGCACG GCAAGAAGCG GCCTATAAGG CGCTTACTTT TCATTTGAAA 
TCACCCCTGA GCGATGAAAT CGATAAGCTG ATTCAAGACG CTTTGGAAAG CCTGTTGGCT 
AGGCGCTACT CGGCGGAGGG GGCAGTAGCA TGA

Protein sequence

MLIDDLTQAL SASEGSSAEQ LKQLKAQLLG HCRAPVKVTD EDVPPLLIAA INFAYGNPTS 
PEQLLSAESA KAALTAKVTP KTIGDMFIWA ALASHMGTHH PKSRNDKVSS GPIVARSLTP 
PPAGLVTSAN LRTRQFSGSG NGANTAHYQW LAFTYEDSAG VFSVIERAAS QDERLGETVL 
TLGIQESQWQ AFQEAAEAHL TVTNSAPLDR QLKQVFIPDP GQNNDFIVIT PLAATAVIGA 
FEQHRTKLRE QDANLNFHRI GVGGAKPQNA GSLMNELGGN LRQLTMTIPR LDLTQRQRRL 
WHLQRGRLFQ PLPKKEAQRF TWWLELDWTQ RYGNRQDHLQ RLEQRIAEWL LPELEVQEQL 
FAWLSSDSLD AVHERQKLEA ENLPNWILTL AGISKNPETE HGTHEARQEA AYKALTFHLK 
SPLSDEIDKL IQDALESLLA RRYSAEGAVA