Gene Noc_1681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1681
Symbol
ID	3705627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1875794
End bp	1877641
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	46%
IMG OID	637738159
Product	Alpha amylase
Protein accession	YP_343683
Protein GI	77165158
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR02402] malto-oligosyltrehalose trehalohydrolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCACT GCCATGGTAT GCCTTTTGGC GCTGAAGTGA CAGAAAAAGG TACCGTGCGT 
TTTCGGTTAT GGGCGCCTGC CGCTAAGCAA GTGGAGTTAT GCTTGGAGGA TACGCTAGAA 
GTAGTCCCCT TAGCTATGAC TCCTAAAGAA GAGGGTTGGT TTGAGCTAGA AACTAAAGAG 
GCTGGTCCGG GCAGTTTATA CTGCTATCAG ATCAATGGTG GGATGCGGGT TCCTGATCCC 
GCTTCTCGAT TTCAGCCCCA AGATATCCAC GGTCCCAGCG AGGTGGTTGA TCCAGCTACT 
TTTAAATGGC AGGAAGAGGG ATGGAATGGA CGACCTTGGG AAGAGGCCGT TATTTATGAA 
ATCCATGTAG GAACTTTTAC CCCAGAGGGT ACTTTTCGAG GATTGGAGAG TCACCTGGAG 
CATCTAGCAA AATTAGGGGT AACCGCATTG GAACTGATGC CGGTTGCCGA TTTCCCTGGC 
CGTTGGAATT GGGGTTACGA TGGTGTTTCC TTGTTTGCAC CAGATAGCCG TTATGGTCGG 
CCCCACGATC TCAAATCCCT TGTGCAAGCT GCCCATGCTT GTGGATTAAT GATATTTTTA 
GACGTGGTGT ATAATCATTT CGGTCCGGAA GGCAACTATC TCCATCAATA TGCCCCAGAC 
TTTTTTACAG AACGCCACCA AACTCCATGG GGGGCAGCTA TCAATTTTGA TGGGAAGAAT 
GCCCATTGGG TCCGGCAGTT TTTTATCCAT AATGCTCTCT TCTGGCTGGA GGAATACCAA 
TTTGATGGCC TTCGGTTGGA TGCGGTTCAT GCGATTCAAG ATGATTCTAA GTTCCATATT 
CTTGAAGAGT TGGCAGAGAC GATTTTCTGC CATCTAGATT CCAGGCGGCG TATACATCTG 
GTGCTAGAAA ATGATAATAA TATAGCCCGT TACCTTACCC GGAAGCCTAA CGGACAACCC 
CGTTGGTACA CTGCGCAATG GAATGATGAT ATCCACCATG CCTTGCATGT ACTCACCACT 
CAGGAAACTA CAGGTTATTA CTTAGACTAT GCCGATCAGC CTATTGCTCA TCTAGGCCGT 
TGTTTGAGCG AAGGTTTTGG TTATCAAGGG CAACATTCTC CTTACAGGGA AGGCAAACCC 
CGTGGCGAGC CTAGCAAGAT TTTACCGCCA AGCGCTTTTG TAACCTTCTT TCAAAACCAC 
GATCAAGTGG GTAACAGGGC TTTCGGTGAG CGAATAACGG CTTTAATAAC ACCTGAAGAA 
GTGAAGGCAT TAACCGCGTT GCTATTGCTC TCTCCTTTCC CGCCCCTTTT ATTTATGGGC 
CAGGAGTGGG GATCAACTCA ACCCTTTCCT TTTTTTTGCG ATTTTAGTGA GGATTTGGCT 
GCAAGTGTTC GGGAGGGTCG GCGAAGGGAA TTCGCCCATT TTCCTGAATT CAATAATCCA 
GCGGCCCAAG AACGAATTCC GGATCCTACC GCTCAGGCGA CCTTTGACAA TGCTGTTTTA 
AACTGGACTC ACGCAACCAA TGGAAAAGGG AAAGAATGGT TTGAGTTACA TCAAAATCTG 
CTAAAACTAC GGCGCCAATG GATCATTCCC AGGCTAGCTG CTATGAGAAA AAACAACGGT 
TGTTATATAC CCTTAGGTAA GCAGGCACTA CAAGTTCGGT GGCAATTAGG CGATGGGGCA 
CAATTAACAA TATTAGCTAA CTTAGGAAAA ATTTCTATTT TCTTATCGAC TCTCCCTTCC 
GGAGAAGTAC TTTTTACCAC CTTTTCAGAT TTAAATAGGA TACTTATCCA CAAAAATCTG 
CCCCCTAAGA CGGTAATTTG GTTTCTCAAA GAGAATTCCA GTGATTGA

Protein sequence

MQHCHGMPFG AEVTEKGTVR FRLWAPAAKQ VELCLEDTLE VVPLAMTPKE EGWFELETKE 
AGPGSLYCYQ INGGMRVPDP ASRFQPQDIH GPSEVVDPAT FKWQEEGWNG RPWEEAVIYE 
IHVGTFTPEG TFRGLESHLE HLAKLGVTAL ELMPVADFPG RWNWGYDGVS LFAPDSRYGR 
PHDLKSLVQA AHACGLMIFL DVVYNHFGPE GNYLHQYAPD FFTERHQTPW GAAINFDGKN 
AHWVRQFFIH NALFWLEEYQ FDGLRLDAVH AIQDDSKFHI LEELAETIFC HLDSRRRIHL 
VLENDNNIAR YLTRKPNGQP RWYTAQWNDD IHHALHVLTT QETTGYYLDY ADQPIAHLGR 
CLSEGFGYQG QHSPYREGKP RGEPSKILPP SAFVTFFQNH DQVGNRAFGE RITALITPEE 
VKALTALLLL SPFPPLLFMG QEWGSTQPFP FFCDFSEDLA ASVREGRRRE FAHFPEFNNP 
AAQERIPDPT AQATFDNAVL NWTHATNGKG KEWFELHQNL LKLRRQWIIP RLAAMRKNNG 
CYIPLGKQAL QVRWQLGDGA QLTILANLGK ISIFLSTLPS GEVLFTTFSD LNRILIHKNL 
PPKTVIWFLK ENSSD