Gene Noc_0381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0381
Symbol
ID	3706552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	422365
End bp	423633
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	61%
IMG OID	637736893
Product	TPR repeat-containing protein
Protein accession	YP_342437
Protein GI	77163912
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCAG AAGCCGTCCC ATTACAGCTT ACCCGTATCC AGGCGCTCGA AGATGTGTTG 
CGGCAGCTCA AGGACGAGAA GCCTGAGTTG GTTGCCTCCT TGCAAGGCGA ATTAGGCAAT 
GCGTTGGCAA CATCATCGAT GGGCTCCTCC CGGGCCTATA ATCTTGAGCA AGCCATCCAG 
GCTTATCAGG CTGCCCTTGA GATCCGGACC CGAAACGATT TCCCCGAGCA GTGGGCCACG 
ACCCAGCATA ACCTGGGCAA CGCCTATGGC AAGCGCATTC GGGGCGTGGG GGCGGAGAAC 
CTGGAAAAAG CCATCCAGGC TTATCAGGCC GCCCTTGAGA TCCGGACCCG AAACGATTTC 
CCCGAGCAGT GGGCCATGAC CCAGCATAAC CTGGGCAACG CCTATGGCAA GCGCATCCGG 
GGTGCGCAGG CGGAGAATCT GGAGCGGGCC CTTGAAGCTT ATGAGGCCGC CCTTACAATC 
TACACCCGCG ATGCTTTCCC CGAGGACTGG GCTATGACCC AGCATAGTCT GGGCAACGCC 
TATCGAGATC GCATTCGGAG CGCGGGGGCG GAGAACTTGG AGCGGGCCCT TGAAGCCTAT 
GGCGAGGCCG CTCGCATTTA CACGACCGAT ACGAATCCTG AAGCGGCGCG TCAGGTTCGA 
CTCGGTCAAA GCGCAGCTTT ACTTAAGGCA GGCCGGTGGC AGGCGGCCCT GGATGCGAGT 
GAGGAAGGGC TTGCGGCTTC CCGGATCTTG TTTGATATTA GCTTACATGA TCCGGAAGTT 
CGGGAACGGG AGATTGGCAC ATCGGAAATG TTATATGCCC ACTGCGCGTT TGCCCAGGCG 
CAACTGGGCA GACCTGATAA GGCGCTGGCG ATTCTAGAAG AAGGCCGGGC CCGGGAGCTG 
CGTTACCGGG CAGGCCGGGA TCGGGCCGAT CTGGAAGACC TTCCAGAGCA GAGAAGGGCC 
GCTTTTTTGC AAGCCGCGCA GCGGGTCCGC GATTTAGAAG CGGAATGGCG GCGGCCCGAG 
GAGGAACGCC CGGCCGATCT AGCGGATAAA ACGCGCCAGG CCCGCCAGGG TCTGGAGCAG 
GAAGCGCAAC AAATCCGCGT GTTAAAGCCG AATTTTCTGC GCGCGTCCGT GGATCTCCAT 
GACATTCGCG CGGTGCTTCC CGGCCAAGAC GCCGCCCTGG TGGAATTTGC AGTCACCGAG 
GCGGGCACCC TCGCCCTGGT GCTGCCGGCG GGGCAAGGGG CGTTGAAGCG GTCTGGATGG 
AGAGCGTGA

Protein sequence

MPSEAVPLQL TRIQALEDVL RQLKDEKPEL VASLQGELGN ALATSSMGSS RAYNLEQAIQ 
AYQAALEIRT RNDFPEQWAT TQHNLGNAYG KRIRGVGAEN LEKAIQAYQA ALEIRTRNDF 
PEQWAMTQHN LGNAYGKRIR GAQAENLERA LEAYEAALTI YTRDAFPEDW AMTQHSLGNA 
YRDRIRSAGA ENLERALEAY GEAARIYTTD TNPEAARQVR LGQSAALLKA GRWQAALDAS 
EEGLAASRIL FDISLHDPEV REREIGTSEM LYAHCAFAQA QLGRPDKALA ILEEGRAREL 
RYRAGRDRAD LEDLPEQRRA AFLQAAQRVR DLEAEWRRPE EERPADLADK TRQARQGLEQ 
EAQQIRVLKP NFLRASVDLH DIRAVLPGQD AALVEFAVTE AGTLALVLPA GQGALKRSGW 
RA