Gene Synpcc7942_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_0101
Symbol
ID	3773441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	101259
End bp	102593
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	57%
IMG OID	637798507
Product	type 2 NADH dehydrogenase
Protein accession	YP_399120
Protein GI	81298912
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCGA CTGTCAGCAA ACCGCGTGTC GTCGTCATTG GCGGCGGTTT TGGAGGGCTG 
TATACCGCCC TCAATCTTGG CAAGACCTCT GTCGAGCTCA CCCTGATTGA TAAACGAAAC 
TTTCACCTGT TTCAACCCTT GCTCTACCAA GTGGCTACAG GGGAAATTTC GCCGGGCGAT 
ATCGCTGCGC CGCTCCGGGC GATCGTAGGT CGTAACCCCA ATACCCGCGT CATTCTCGGT 
GAAGTGACTG ACATCGATCC GCAGGCCCAT TGGGTGCGCG TTGGCGATGA AATTGTCGAA 
TACGACTACT TGGTTGTGGC GACGGGTGCC AGCCACCACT ACTTTGGCAA CGACCAATGG 
CAGCCCTTTG CTCCGGGGCT GAAAACGGTT GAAGATGCGC TGGAAATGCG CCGCCGGATT 
TACTTTGCCC TCGAGCAAGC TGAGCAGGAG AGCGATCCAG AGCGTCAGCA AGCTTGGTTG 
ACCTTCACGA TCGTGGGAGC AGGCCCCACC GGCGTTGAAC TAGCTGGCGC GATCGCGGAA 
TTAACCCGCG GTGAAATGCG CAAAGAATTC CGCAATGTCG ACACCACCAA AGCCAAGGTC 
ATTTTGATTG AAGGCATGGA TCGGGTCTTA CCACCCTTCC CGCCAGAGCT GTCAGCCCAA 
GCGCAAGTAC AGCTAGAAGG CTTGGGCGTG ACTGTGCAAA CCAAAGCCAT GGTCACCGAC 
ATTCAAGAAG ATCGCGTCGT CTTTAAGACT GGCGACGACT TGCATGAGAT CCCTAGCCGC 
ACGACCCTTT GGGCTGCGGG CGTCAAAGCG TCACCCTTGG GCAAGCTCCT AGCGCAACGA 
ACCGGTGCAG AACTCGATCG CATTGGTCGC GTCATCGTCC AGCCTGATTT GCAGCTGCCG 
ACTGACCCCA ACGTCTACGT CTTGGGTGAC CTGGCCCACT GCCCTGATCA AGCAGGCAAC 
CCACTGCCCG GTGTGGCAGC AGTCGCGATG CAGCAGGGGG CTTATCTCGG TAAGGCACTC 
AAGCGGCGGC TGAAGAGTCA ACCCGTTGAT CCCTTCCGCT ACCAAGACTT CGGCAGCATG 
GCAGTGATTG GCCGTAACGC TGCGGTTGCC CGCTTAGCAG GTATTCGCCT CAGTGGTTTC 
CCCGCATGGC TGGTCTGGGC TTTTATCCAC GTCTGGTATT TGATTGAATT CGACAGCAAA 
TTGCTGGTGA TGGTGCAGTG GGCTTGGACC TACTTCAACC AGAAACGCGG CACTCGCCTA 
ATCGTCAATC ATCACCGCAT GTCGGCCCCG GCAGCGATGA CTAATCCGGC CGAAAAAGAG 
TTGGCGAAGT CCTAG

Protein sequence

MISTVSKPRV VVIGGGFGGL YTALNLGKTS VELTLIDKRN FHLFQPLLYQ VATGEISPGD 
IAAPLRAIVG RNPNTRVILG EVTDIDPQAH WVRVGDEIVE YDYLVVATGA SHHYFGNDQW 
QPFAPGLKTV EDALEMRRRI YFALEQAEQE SDPERQQAWL TFTIVGAGPT GVELAGAIAE 
LTRGEMRKEF RNVDTTKAKV ILIEGMDRVL PPFPPELSAQ AQVQLEGLGV TVQTKAMVTD 
IQEDRVVFKT GDDLHEIPSR TTLWAAGVKA SPLGKLLAQR TGAELDRIGR VIVQPDLQLP 
TDPNVYVLGD LAHCPDQAGN PLPGVAAVAM QQGAYLGKAL KRRLKSQPVD PFRYQDFGSM 
AVIGRNAAVA RLAGIRLSGF PAWLVWAFIH VWYLIEFDSK LLVMVQWAWT YFNQKRGTRL 
IVNHHRMSAP AAMTNPAEKE LAKS