Gene HS_0412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0412
Symbol	dprA
ID	4239888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	437995
End bp	439101
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	38%
IMG OID	638103955
Product	DNA processing chain A
Protein accession	YP_718622
Protein GI	113460558
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.232612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC GGAATGAGCT GTTACTGCGT TTGTTACAAG TGCCGAAGTT GGGAGCGTCC 
GGAATAACTC AACTTTTATC ACACATCGAT TTAAAAACAT TAGAGGATTA TGATGATGTT 
GCGTTTCATT ATTTAGGCTG GAAACCTGAA CAGATAAATA GATGGTTGTA TCCGGATCTT 
AGATATATTG AACCTGCATT ATTTTGGGCA AGCAAAAAGG GACATTATTT GATGAATTTC 
TATCAAGAGA ATTACCCTTA TTTATTAAAG CAAACCATAG GTGCTCCCCC TTTGTTATTT 
ATCAAAGGCA ATCCGGAAAT ACTTGCTCAA CAACAAGTCG CTATTGTAGG AAGCCGTCAT 
TGCTCACATT ATGGCGAGTA TTGGGCAAAG TATTTTGCAA CGGAATTGTT CCTTGCCGGT 
TTTGTTATTA CCAGTGGACT GGCTTTAGGG ATTGACGGTT TTTGTCATCA GGCTGTTGTG 
GATATTCAAG GACAAACTAT CGGGGTATTA GGGGGAGGTT TGGAAGAGTT GTATCCCAAA 
CAACATAAAA AATTAGCACA ACAAATGCTA GATTATGGCG GTGCGTTAGT GTCAGAATTT 
TTACCTCATC AGCCTCCCAA ACCACAACAT TTTCCTCAAC GTAATCGCAT TATTAGCGGA 
CTTTCTAAAG GTGTTTTAGT GGTTGAGGCA ACAGAAAAAA GCGGTTCACT CATTACTGCA 
CGTTATGCTT TAGAACAAAA TAGAGAAGTT TTTGCACTTC CAGGACAAAT TCAAAATGAG 
TATAGTCAAG GGTGTCATAG ATTAATAAAA GACGGTGCAT TGTTAGTAGA GAATGTTGCA 
GATATTGTAG AAAATTTATC GCCTTTTATG CATTATGAAC GTCAACTAAC AGCAAAACAG 
ATAGAAACGC AATTTCCGCC GGCTTATAAG TTACCTGCTT CACCGACTTA TCCTGAACTC 
TATGCCCATA TTGGTTATAC GCCGGTAGGG CTTGATGAAT TATCAAATAA AAGCGGATTA 
AGTGTAGATA CCTTATTGAT ACAGCTGTTA GAACTTGAAT TGCAAGATCT CGTTATTGCT 
GAAAAAGGGT TATATCGACG GACTTAA

Protein sequence

MDKRNELLLR LLQVPKLGAS GITQLLSHID LKTLEDYDDV AFHYLGWKPE QINRWLYPDL 
RYIEPALFWA SKKGHYLMNF YQENYPYLLK QTIGAPPLLF IKGNPEILAQ QQVAIVGSRH 
CSHYGEYWAK YFATELFLAG FVITSGLALG IDGFCHQAVV DIQGQTIGVL GGGLEELYPK 
QHKKLAQQML DYGGALVSEF LPHQPPKPQH FPQRNRIISG LSKGVLVVEA TEKSGSLITA 
RYALEQNREV FALPGQIQNE YSQGCHRLIK DGALLVENVA DIVENLSPFM HYERQLTAKQ 
IETQFPPAYK LPASPTYPEL YAHIGYTPVG LDELSNKSGL SVDTLLIQLL ELELQDLVIA 
EKGLYRRT