Gene Phep_4075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4075
Symbol
ID	8255209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4917335
End bp	4918372
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	44%
IMG OID	644937739
Product	NADH dehydrogenase (quinone)
Protein accession	YP_003094328
Protein GI	255533956
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.329571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATAG CTTTTGTAAT CGAAAAATTT GTACTTGTAG CTATCATTTT TGGTATCAGT 
TTGCTGATTG CCATGTATTC TACGTATGCA GAAAGAAAAG TGGCAGCCTT TTTACAGGAC 
AGACTTGGAC CAGACAGAGC CGGTCCTGCA GGAATGTTCC AGCCTTTGGC CGATGGTTTA 
AAGATGTTTA TGAAGGAAGA AATCATTCCT TCAAATGCGA GCAAATGGTT GTTCATGGTT 
GGGCCTGGCC TGGCGATGCT TACTGCTTGC ATTGGTACTG CCGTGATCCC ATGGGGAAGT 
CCGGTTACCA TTGACGACAG GGTGGTCCCT TTACAGGTAA CCGATATCAA TGTGGGCCTG 
CTGTATATCT TTGGTGTAGT TTCACTGGGG GTATATGGGG TTATGATTGG TGGCTGGGCT 
TCAAACAACA AATATTCTTT GCTGAGTGCC ATCAGGGCCG CTTCGCAGAA CATCAGTTAT 
GAAATTGCCA TGGGCTTGTC TATCATAGCC CTGTTATTGG TAACCAATAC GCTGAGCTTA 
AAAGAAATTG TGGAGCAGCA GCATGGCTGG CACTGGAATG TACTGTATCA GCCACTGGGC 
TTTATCCTGT TTATGGTGTG TTCATTTGCT GAGACCAACA GGGCACCTTT CGATTTGCCT 
GAATGTGAAA CGGAACTGAT CGGGGGCTAC CATACTGAAT ATTCTTCCAT GAAACTGGGT 
TTCTATCTGT TTGCAGAGTA CATCAATATG TTTGTTTCGG CAGCAGTAAT GGCCACCTTA 
TATTTTGGTG GATATAATTA TCCCGGAATG GATTGGATGG CCACATTATT GGGGCCAACC 
TGGGCGCCAC TTTTTGGTAC CTTGGTGTTC TTCGTTAAAA TATTTGTATT TATATTTTTC 
TTCATGTGGG TACGCTGGAC CATTCCGCGT TTCCGCTATG ATCAACTGAT GCATTTAGGC 
TGGAAAGGAC TGATCCCTCT GGCGATAGCG AACATCGTGA TCACAGGTAT TGTGATCGCA 
ATAATTGAAA AGTTTTAA

Protein sequence

MDIAFVIEKF VLVAIIFGIS LLIAMYSTYA ERKVAAFLQD RLGPDRAGPA GMFQPLADGL 
KMFMKEEIIP SNASKWLFMV GPGLAMLTAC IGTAVIPWGS PVTIDDRVVP LQVTDINVGL 
LYIFGVVSLG VYGVMIGGWA SNNKYSLLSA IRAASQNISY EIAMGLSIIA LLLVTNTLSL 
KEIVEQQHGW HWNVLYQPLG FILFMVCSFA ETNRAPFDLP ECETELIGGY HTEYSSMKLG 
FYLFAEYINM FVSAAVMATL YFGGYNYPGM DWMATLLGPT WAPLFGTLVF FVKIFVFIFF 
FMWVRWTIPR FRYDQLMHLG WKGLIPLAIA NIVITGIVIA IIEKF