Gene Noc_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2101
Symbol
ID	3704411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2414935
End bp	2415972
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	54%
IMG OID	637738576
Product	biotin synthase
Protein accession	YP_344091
Protein GI	77165566
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTACT TTCCTCCTGC AGCTGAAATA TGTGACAGTC CGCGCCACGA TTGGTCTATC 
CCAGAGGTGC TGGCTTTGTT TGAATTACCG TTTGTAGAAC TTATTTATCG GGCGCAGACG 
GTACATCGCC AGCATTTTAA TCCTAATCAA GTTCAGATGA GCACTTTGCT CAGTATTAAA 
ACGGGGGGAT GTCCCGAAGA TTGTGCCTAT TGTCCCCAAA GTGTTCGCTA TAGCACGCCC 
GTGAAAGCCG AACCTTTACT GCCCCTGGAG GAAGTATTGA CGGCGGCACG GAATGCCAAG 
GCCCGGGGTG CAAGCCGTTT TTGTATGGGA GCGGCATGGC GCAGGCTCAA GGAGCGGGAG 
CTGGAACCGG TAGCGAAGAT GATTACAGAG GTGAAAGCCC TGGGGTTAGA AACATGCGTG 
ACATTAGGCA TGTTAGGTCC AGGACAAGCG GAACGGCTTA AGGCTGCGGG ACTAGATTAT 
TACAACCATA ATCTGGATAC CTCACCGGAG TTTTACGGCG AGATCATTAC CACCCGTACC 
TATCAGGATC GGCTGGAGAC CTTGTCTCAA GTCCGGGAAG CGGGCATTCA TGTGTGTTGT 
GGCGGTATTG TGGGGATGGG CGAGGAGCGT TCTGATCGGG CGGGTTTGTT GGCCAACTTG 
GCTAATCTGC CCCGTCACCC GGAGAGCGTT CCAATTAATA GGCTGGTCCA GGTAGAAGGT 
ACCCCCTTGG CCGGGGCTCC CGAGCTAGAC CCCTTTGAGT TTGTGCGTAC CGTGGCCTGC 
GCTCGAATCC TGATGCCCGC CTCCTTCGTG CGCCTTTCAG CAGGCCGAGA GACAATGAGC 
GATGAATTGC AAGCTCTTTG TTTTCTTGCT GGAGCCAATT CCATTTTTTA TGGTGAAAAG 
CTGCTCACGA CCCCCAATCC AACCACAGAT CACGACCAGC AATTGTTTGA GCGTTTGGGT 
CTTGAGCTTT TGTTTCCCCA GGCACAGGTT GCCGCTCCCG TGCCGGAGGC TGATGAAGTG 
GGATCGGCCT CTGGCTGA

Protein sequence

MTYFPPAAEI CDSPRHDWSI PEVLALFELP FVELIYRAQT VHRQHFNPNQ VQMSTLLSIK 
TGGCPEDCAY CPQSVRYSTP VKAEPLLPLE EVLTAARNAK ARGASRFCMG AAWRRLKERE 
LEPVAKMITE VKALGLETCV TLGMLGPGQA ERLKAAGLDY YNHNLDTSPE FYGEIITTRT 
YQDRLETLSQ VREAGIHVCC GGIVGMGEER SDRAGLLANL ANLPRHPESV PINRLVQVEG 
TPLAGAPELD PFEFVRTVAC ARILMPASFV RLSAGRETMS DELQALCFLA GANSIFYGEK 
LLTTPNPTTD HDQQLFERLG LELLFPQAQV AAPVPEADEV GSASG