Gene Noc_2215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2215
Symbol
ID	3705095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2558305
End bp	2559465
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	54%
IMG OID	637738691
Product	hypothetical protein
Protein accession	YP_344205
Protein GI	77165680
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCTATT TATTGCTTTT AATCATCAGA AACGCATTCC GCCAAAAGCT CCGCACCATC 
CTGACCATGG TGGGGATCGT CATTGCAACG GTGGCCTTTG GCCTGCTGCG CACGGCGGTT 
GAGGCTTGGT ATGCGGGAGC GGAGGCAGCT TCGGCCACCC GCCTTATCAC CCGCAACGCC 
ATCTCCCTAG TTTTTCCCCT GCCCCTGAGC TACCAAAACA AAATCCAGCA AATCGAGGGG 
GTCGCCACCA CCAGCTATTC CAATTGGTTT GGAGGCGTTT ATATCAGCGA AAAGAATTTT 
TTTCCCCAAT TCGCCATCGA ACCCCGCAGC TATCTTAAAC TTTATCCGGA ATATCTCCTC 
TCGCCCCAAG AGGAAAGAGA TTTTTTTCGC GATCGCCAAG GCGCTATTAC AGGCGAAAAG 
CTGGCGCAAA AATACGGCTG GAAAATCGGC GATGTCATCC CCATCCGGGG GACGATCTAC 
CCCGGCGACT GGAATTTTAT CCTGCGGGGC ATTTATAAGG GAGCCAGCGA GAGAATTGAT 
GAAACCCTCT TCCTTTTTCA CTGGGAATAT TTAAATGAAA AATTAAAACA AACCGGCGCT 
GAACGGGCCA ATCACGTGGG CGCCTATGTG GTCGGCATTG AACAGGCCAG CCAGGCCGCC 
CAAATCTCTC AAGCTATTGA CGGTCTTTTT GCCAACTCTC TGGCGGAAAC CCTCACGGAA 
ACCGAAAAAG CCTTTCAGCT TGGTTTTGTC GCCATGACCG AAGTTATTGT GACCATTATT 
GAGGTGGTTT CCTTCGTTAT TCTCATTATT ATTTTGGCGG TCATGGCCAA CACCATGGCG 
ATGAGCGCCC GGGAACGCAA GCGGGAGTAC GCCACGCTCA AGGCACTCGG ATTTCCTGGC 
AGTTTTATTG CTTTATTGAT TACCGGGGAG TCGATGGTGA TTGCCCTAGT GGGGGGTCTC 
TTCGGACTGT TGCTGCTGTA TCCCGCGGCA GATAGCTTTG CCAGTAAAAT AGGCACTTTC 
TTTCCCGTCT TCCGGGTGAC CCCGGAAACC GCCTGGCTGG CCATGGGCAT TGCCCTCGTG 
GTGGGTCTCG CCGCCGCCGC CATTCCTGCC TGGCGGGGCG CGGCAGTATC GGCCACGGAA 
GGGTTCCGGC AAATCGGTTA G

Protein sequence

MRYLLLLIIR NAFRQKLRTI LTMVGIVIAT VAFGLLRTAV EAWYAGAEAA SATRLITRNA 
ISLVFPLPLS YQNKIQQIEG VATTSYSNWF GGVYISEKNF FPQFAIEPRS YLKLYPEYLL 
SPQEERDFFR DRQGAITGEK LAQKYGWKIG DVIPIRGTIY PGDWNFILRG IYKGASERID 
ETLFLFHWEY LNEKLKQTGA ERANHVGAYV VGIEQASQAA QISQAIDGLF ANSLAETLTE 
TEKAFQLGFV AMTEVIVTII EVVSFVILII ILAVMANTMA MSARERKREY ATLKALGFPG 
SFIALLITGE SMVIALVGGL FGLLLLYPAA DSFASKIGTF FPVFRVTPET AWLAMGIALV 
VGLAAAAIPA WRGAAVSATE GFRQIG