Gene NATL1_20051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20051
Symbol	hycB
ID	4779490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1648436
End bp	1649458
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	41%
IMG OID	640085296
Product	Fe-S-cluster-containing hydrogenase components 2
Protein accession	YP_001015825
Protein GI	124026710
COG category	[C] Energy production and conversion
COG ID	[COG1142] Fe-S-cluster-containing hydrogenase components 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0456807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTAATC AAAATTCAAC TTGCAATTCG GAAGCTCTCA AAAAAGGTAA CTGGGTAAAA 
TTAATCTGTG GTGCAAGTAA TCAAGATTTA CCTTCAATAA ATGATCTTTG CTCAATTTAT 
GGGGCTGCGG GGGTGCATTG CATTGACCTA GCTGCCGACG AAGCTGTTGT CCATGCAGCT 
CGCAATGCTA TTGATTGGGT TTTCGAAACT TATGGAAAAA AACCATGGCT GATGATCAGT 
TTAAGTGATG GGAAAGATTC ACATTTTCGC AAAGCTTGGT TTAATCCAGA CCTATGTCCA 
TCGAATTGCT TAAGACCCTG TCAAAATAGT TGTCCGGCTC ACGCGATTGA AAACTCAGGT 
GGTGTAAATG CTAAAAAATG CTATGGATGT GGTCGATGTA TTGATACATG CCCTTTAGGA 
ATTATTCAAG AAAAAGATCG AAGATTAACT CTGAGAGATT TCGCTCCTTT GTTAACCACT 
ATCAAACCAG ATGCAGTAGA AATTCATACT GCTCCAGGAA GAGGCAAAGA ATTTGAAAAA 
ACAATCAAGG AAATTTTCAA AGCCGACCTG CAGCTAAAGC GATTATCTGT TAGTTGCGGT 
TTACAAGGAC ATGGAATAAA CCATGAACAA TTAGCAGAAG AACTTTGGCT GCGACATAAA 
TTCCTGAGAA TTCATAATCA AAAACCTCTT TGGCAAATTG ATGGGCGTCG AATGAGTGGA 
GATCTCGGAG CAGGTGCGGC CAAAATCGCT GTAAAACTTT GGGAAAGATT ACGCCCCATT 
GCTCCACCAG GCCCGTTGCA ACTTGCTGGA GGGACTAATG AATCGACAAT TAAGTACCTC 
CCAGAAATTA AAGGACCTGA AGGAATTGCT TTTGGAGGAA AAGCAAGAAA GATAATCCAA 
CCATGGCTAG AAGAAGCTCA ACGAAAAGGA ATTAGTCTTA GAGAATGGCC CGAAGGCTGG 
GAGGCGGCTC TTTCAGAGGC AAAGCGACTA ATAAATCCTT GGCTTGTAAG AAAATCTTTA 
TAA

Protein sequence

MINQNSTCNS EALKKGNWVK LICGASNQDL PSINDLCSIY GAAGVHCIDL AADEAVVHAA 
RNAIDWVFET YGKKPWLMIS LSDGKDSHFR KAWFNPDLCP SNCLRPCQNS CPAHAIENSG 
GVNAKKCYGC GRCIDTCPLG IIQEKDRRLT LRDFAPLLTT IKPDAVEIHT APGRGKEFEK 
TIKEIFKADL QLKRLSVSCG LQGHGINHEQ LAEELWLRHK FLRIHNQKPL WQIDGRRMSG 
DLGAGAAKIA VKLWERLRPI APPGPLQLAG GTNESTIKYL PEIKGPEGIA FGGKARKIIQ 
PWLEEAQRKG ISLREWPEGW EAALSEAKRL INPWLVRKSL