Gene Phep_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1038
Symbol
ID	8252132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	1214267
End bp	1215451
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	38%
IMG OID	644934691
Product	helix-turn-helix- domain containing protein AraC type
Protein accession	YP_003091320
Protein GI	255530948
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.895405
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.923131
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTTT TGAATTTTTT AACCAGCATT ATCTGCTTTT TTTTATTGCT GTTCTCCTTC 
AACCTGTTTT TCGCCAAACG GGGTAATCCT GTATTGAATT ATTTACTGGG AGTTATCTTT 
TTTTCGAGAT TCGGTCAAAT GTTGGTCCTT TTATTGGTAA ACTCAAAACA GCAGACTTAT 
TTTCCTTTTT TTCATCAGCT TTTTACCCCA TTGTACTTTG CCGCCCCGGC TTGCTTTTAC 
CTTTATGTCA GCCATTTTAT TAACCCGGAT AAAAAATTAC CCTACAAGGA GTGGCTTCAT 
TTTATCCCTG CTGCCCTGGC CATTATCCAT GTTATCCCAT GGCCTTTTGC TCCGGTTATC 
AACTGGCACG ATATCTTAAA ACAGATCACT GATAATAAAC AGCTTTTTAT TAACGAAAGG 
AGCGGGATAT TACCGGCCTA TTTATATTCT GTAGGCAGGC CTGCATTGGT ACTTGGTTAT 
TTAGCCGCCA CCTGGTATAG GGTGTTAAAT TCGGAGGTAT TGAAAGCAAA ACCCAAAGCA 
GATACTGGTA AGAAATGGAT CTTACTTTTT GTAAAGGCAG CAACGTTTTT CCAGCTCGTT 
AGTTTTTTGC CATTGCTCAG TACAAGCCAG GACAGAACTT ATGCCAATTC CATATTTGTG 
ATCATCAGCT GTCTCGTTTT GATTGTTATT GTTGTGTTCA TCCTACATCA GCCGGATATT 
TTTTACCGTT ATTTAATAAC GCCTATTGAT GGTATAAAAG TCGCAGATAA AGGCCAGGAA 
AGGGTAGAAG ATACTACATT GAATACCGGT AGTACTAAAA AAATCATCTT ATTACCTGAA 
CAATCAGCTG CATACGCAGC TGAGATGGAA GCCTTAATGG CAGCTAAAAA GTTATACCTG 
ATATCGGATT TTCAGATTGT TGACCTGGCT GCTGAAATGA ATATTTCTGT TCATCACTGC 
TCATTTGTAA TCAACAACGT AATCGATAAA AACTTTCGTG ATTGGATAAA TGGTTACCGC 
ATTAGCTATT TTAGCACACA ATATCCACTT CACGCGCACA AAATGACCAT TGAAGCCATT 
GCTCATGAAT CTGGCTTTAA AAGCCTGGCA ACTTTTTACA ATGCCTTTAA AAAAGAGACA 
GGTTTGATGC CCAAAGCCTA TTTCTCACAA AAGAAGGTAT CATAA

Protein sequence

MGFLNFLTSI ICFFLLLFSF NLFFAKRGNP VLNYLLGVIF FSRFGQMLVL LLVNSKQQTY 
FPFFHQLFTP LYFAAPACFY LYVSHFINPD KKLPYKEWLH FIPAALAIIH VIPWPFAPVI 
NWHDILKQIT DNKQLFINER SGILPAYLYS VGRPALVLGY LAATWYRVLN SEVLKAKPKA 
DTGKKWILLF VKAATFFQLV SFLPLLSTSQ DRTYANSIFV IISCLVLIVI VVFILHQPDI 
FYRYLITPID GIKVADKGQE RVEDTTLNTG STKKIILLPE QSAAYAAEME ALMAAKKLYL 
ISDFQIVDLA AEMNISVHHC SFVINNVIDK NFRDWINGYR ISYFSTQYPL HAHKMTIEAI 
AHESGFKSLA TFYNAFKKET GLMPKAYFSQ KKVS