Gene Ccur_00990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccur_00990
Symbol
ID	8374307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptobacterium curtum DSM 15641
Kingdom	Bacteria
Replicon accession	NC_013170
Strand	+
Start bp	123620
End bp	125350
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	51%
IMG OID	644993023
Product	Ni,Fe-hydrogenase III large subunit
Protein accession	YP_003150514
Protein GI	256826555
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.823272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	144
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACAA GACCTTTAGA GAAACGGCCG GGTGCGACGC ACGCTGAAGC GGTGCGCAAT 
CGCTTCCCTG GCGTGGTGCG AGACGTGAGC TGGCAGGATG AAGATCAAAT GACGATCACT 
GTCGCCATTG ATTCGCTGCC TGACGTTGTC GAATACCTTT ACTTTGGTCG TGGTGGATTT 
CTGCCGATGA TGGTAGGTAA CGACGAACGT CCACTGACGG GCAATTACGC GCTGTACTAT 
ATTTTATCTA TGGAAGAAGA AGATCCATGC TGGTGCACGG TGCGTGTTGA GGTGCCAGCC 
GATACATGCG AGTTCCCTTC AGTAACACCG CGTGTTCCTG CTTGCGTATG GAGCGAACGC 
GAAGTACGCG ATATGTACGG CCTCACTCCT GTTGGTTTAC CTGATGAACG TCGCCTGGTT 
CTTCCTGATG ACTGGCCAGA CGACCTTTAT CCGCTGCGTA AGGACTCGAT GGATTACCGT 
CATCGTCCTA TGCCAGCAAG CGATGTAGAA AATTATGAAT TCCTGGCTGA TACGGGCGAG 
CATGAAACGA CAATCATGCC TATGGGTCCG TTGCATATTA CCTCTGACGA ACCCGGACAT 
TTTCGCCTGT TCGTCGAAGG TGAAAACATT ATTGATGCAG ATTATCGCTT GTTCTATGTT 
CATCGCGGCA TGGAAAAAGT TGCTGAATCG CGTATGAATT ATGATGCGGT TACCTTCCTG 
GCCGACCGTG TTTGTGGCAT TTGCGGTAAC GCTCATTCGG TTGCGTACGC CGAGGCAGTC 
GAGCATGCTC AAGGTATTGA AGTACCCGAG CGTGCCCAGT ATATTCGTGC TATCTCGTTG 
GAAGTTGAGC GCATGCACTC TCATCTGCTC AACTTAGGCT TGGTATGTCA CTACTGCGGT 
TTTGATACGG GTTTCCAGCA TTTCTTCCGC GTACGCGAAG ATTCGATGCG TCTTGCTGAA 
TTGCTGACCG GTCATCGCAA GACCTATGGC ATCAATCTTA TCGGCGGTGT GCGCCGCGAT 
ATCCTTTCCG AGCAGAAGCT GGCGACATTC AAAGCGGTTG ATAAACTGCG TAAAGACGTT 
AAAGGCTTGG TTGACGAGCT AATGAGCACG CCAAACTTTA TTGATCGTAC AAAAGGTGTT 
GGGCGACTTG ACCCGCAGAT CGCTCGTGCA TTTAGCCCAG TTGGTCCCTG CATGCGTGGT 
TCAGGCTTTA CACGCGACGT GCGGTTTGAT CATCCATTCG ATGGCTATAA GTTCCTGCCG 
GACACCTTCA AAGCACGTTC ACATGATGGT TGCGATGTTA TGAGCCGCTC TATGGTTCGT 
ATCGAAGAGT TCCTTGATAG CTGCGATATG GTTGAATATC TGCTCGATAA TGCACCAGAA 
GGTCCAATTC TGACGCAGGA TTGGACGTAC ACGCCGCATA AATATGCGTT GGGTTATACT 
GAGGCGCCGC GCGGCGAGGA TACACACTGG GCTATGGTTG GCGATAACCA AAAGTGCTAT 
CGCTGGCGTG CCAAGGCAGC TACGTATAGT AACTGGCCTA TTCTGCGCTA TATGTTCCGT 
GGCAATACCA TTTCTGATGC AGCGCTTATC GTCGGCAGTA TGGACCCGTG CTACTCTTGT 
ACTGACCGGG TAACGGTGGT AGACGTTGAG AAGAACACCA GTAAGACACT CACAAAAGAT 
CAGCTGGAAT CATACTGCGT CCGCCGTACG CATTCTCCGC TGAAGGATTA G

Protein sequence

MDTRPLEKRP GATHAEAVRN RFPGVVRDVS WQDEDQMTIT VAIDSLPDVV EYLYFGRGGF 
LPMMVGNDER PLTGNYALYY ILSMEEEDPC WCTVRVEVPA DTCEFPSVTP RVPACVWSER 
EVRDMYGLTP VGLPDERRLV LPDDWPDDLY PLRKDSMDYR HRPMPASDVE NYEFLADTGE 
HETTIMPMGP LHITSDEPGH FRLFVEGENI IDADYRLFYV HRGMEKVAES RMNYDAVTFL 
ADRVCGICGN AHSVAYAEAV EHAQGIEVPE RAQYIRAISL EVERMHSHLL NLGLVCHYCG 
FDTGFQHFFR VREDSMRLAE LLTGHRKTYG INLIGGVRRD ILSEQKLATF KAVDKLRKDV 
KGLVDELMST PNFIDRTKGV GRLDPQIARA FSPVGPCMRG SGFTRDVRFD HPFDGYKFLP 
DTFKARSHDG CDVMSRSMVR IEEFLDSCDM VEYLLDNAPE GPILTQDWTY TPHKYALGYT 
EAPRGEDTHW AMVGDNQKCY RWRAKAATYS NWPILRYMFR GNTISDAALI VGSMDPCYSC 
TDRVTVVDVE KNTSKTLTKD QLESYCVRRT HSPLKD