Gene Tery_3133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3133
Symbol
ID	4244263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	4789405
End bp	4790532
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	36%
IMG OID	638108143
Product	NADH:flavin oxidoreductase/NADH oxidase
Protein accession	YP_722736
Protein GI	113476675
COG category	[C] Energy production and conversion
COG ID	[COG1902] NADH:flavin oxidoreductases, Old Yellow Enzyme family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.656366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.303319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCAAC TAAAAATACT TGAACCATTT ACACTAGGAG ATTTACAATT ACCTAATCGA 
ATTGTAATGG CACCTTTAAC CAGAAGACGT GCTGATATTA ATAATGCTCC TACCCCATTA 
AATGCCTTAT ATTATAGTCA AAGATCTTCT GCTGGTTTAA TTATTAGTGA AGCTAGTCAA 
ATTTCTCCCC AAGGTACAAG TTTACCAAAA ACTCCCGGAA TTTATAGCCA AAAGCAAATT 
GAAGGGTGGC AACTGGTCAC AAAAGCCGTA CACAATTCTG GTGGTAGAAT TTTTATACAA 
TTATGGCATG GTGGACGATG TTCCCATCCT TCTTTACAAC CTAATGGAGA ATTACCTGTT 
GCACCTAGCG CGAGGGCCCC GATAGAGGAA AAAGCCTTAA CAGCACAGGA AAAAGAAGTC 
CCTTTTGTTA ATCCAAGAAG TCTTTTAACC ACAGAAATAC CTGAAATTAT TGCTCAATAT 
CGTCAAGGAG CGATAAATGC TTTAGAAGCA GGTGCTGATG GTGTAGAAAT TCATGGTGCA 
AATGGTTATT TACTAGATCA GTTTTTACAA GATAATAGTA ATCAACGCAC TGATAAATAT 
GGTGGAAGTA TCGAAAACCG TAGTCGTTTA CTCTTAGAAG TAACTCAAGC AGTAACAGAA 
GTTTGGGGCT CGCAGCGTGT AGGAATACGT CTTTCTCCTA GTAGTACCTA TCAAGATATG 
TATGATTCTA ACCCAGAGGC TTTATTTAAT TATATAGTAA GCAAAATCGA TCAGTTTAAT 
TTAGCTTATC TTCATATTGT TGAGCCTCGA ATAAAAGGCA GTCACGATGA TTTAACTGAA 
AAGAAATTAC AACTTGGAGT TAAACATTTC CGCCCTTTAT ATAGTGGAAA TTTAATGACA 
GCTGGAGGTT ATACCCGCGA TCTAGGAGAA GAGATAATTA GTCAAGGTTA TACTGATTTA 
GTAGCTTATG GAAGGCTATT TATTGCTAAT CCCGATCTAC CTAAACGTTT TGCCTTAAAT 
GCACCATTAA ATCCTTATTA TCGTCCTACT TTTACGGGAG GAAATGAGAT AGGATATACT 
GATTATCCTT TTCTATCAAT TGATACACTT GCCAAGAATA TAATTTGA

Protein sequence

MNQLKILEPF TLGDLQLPNR IVMAPLTRRR ADINNAPTPL NALYYSQRSS AGLIISEASQ 
ISPQGTSLPK TPGIYSQKQI EGWQLVTKAV HNSGGRIFIQ LWHGGRCSHP SLQPNGELPV 
APSARAPIEE KALTAQEKEV PFVNPRSLLT TEIPEIIAQY RQGAINALEA GADGVEIHGA 
NGYLLDQFLQ DNSNQRTDKY GGSIENRSRL LLEVTQAVTE VWGSQRVGIR LSPSSTYQDM 
YDSNPEALFN YIVSKIDQFN LAYLHIVEPR IKGSHDDLTE KKLQLGVKHF RPLYSGNLMT 
AGGYTRDLGE EIISQGYTDL VAYGRLFIAN PDLPKRFALN APLNPYYRPT FTGGNEIGYT 
DYPFLSIDTL AKNII