Gene DET1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET1087
Symbol
ID	3229624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	-
Start bp	988488
End bp	989822
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	56%
IMG OID	637120651
Product	HK97 family portal protein , putative
Protein accession	YP_181802
Protein GI	57234157
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATAT TTTCAGGATT ATTTCGGAGC CGGGATAAGC CCAAGGACGC GACCAGCGGA 
AGCTCCTACC GCTTCTTCTT CGGCGGCACG ACCTCCGGCA AAGCTGTAAC GGAACGCTCC 
GCCATGCAGA TGACGGCGGT CTACTCCTGC GTTCGGATTC TATCCGAGGC GATTGCTGGC 
CTGCCCGTTC ACCTGTACCG GTACGACGGC AGCGGCGGCA AGGAAAAAGC GACCACTCAT 
CCGCTCTACT TCCTATTGCA TGATGAGCCA AACCCGGAAA TGACATCCTT TGTCTTTCGG 
GAAACGCTGA TGACGCACCT TTTGCTGTGG GGAAACGCCT ACGCGCAGAT CATCCGAAAT 
GGCAAGGGCG AGGTCGTGGC TCTCTATCCG CTTATGCCAA ACCGCATGAC GGTTGACCGC 
GACGCAGACG GTCACCTCTA CTACGAATAT CAGACCTCGC AGGATGAGGC GCACACGATG 
GATGGCAGCC GCGTCAGGCT CTCTCCAAGC GATGTGCTCC ATATTCCCGG CCTTGGCTTT 
GACGGCCTGA TGGGCTACAG CCCGATTGCG ATGGCAAAGA ACGCTATCGG CATGGCGATT 
GCCTGTGAGG AATACGGAGC TAAGTTCTTC GCTAACGGCG CGACGCCCGG CGGCATCTTG 
GAGCATCCCG GTGTGATAAA AGACCCGGAG CGTGTCAGGG AAAGCTGGAA CTCAGCCTTC 
GGCGGCAGCG CCAATGCAAA CAAGGTGGCG GTTCTTGAGG AGGGCATGAA ATACACGCCC 
ATCTCCATTT CACCGGAGCA GGCGCAGTTC TTGGAGACGC GGAAGTTCCA GATCAATGAG 
ATCGCTCGTA TCTTCCGCAT CCCGCCTCAT ATGATCGGCG ACCTTGAGAA ATCGAGCTTT 
TCCAACATCG AGCAGCAGTC GCTGGAGTTC GTGAAATACA CGCTCGACCC GTGGGTCTGC 
CGCTGGGAAC AGTCCATGCA GCGGGCGCTT TTGTCTATGG ACGAGAAGAA GGAATACTTC 
TTCAAGTTCA ATGTGGACGG CCTGCTTCGC GGAGATTACC AGAGCCGCAT GAACGGCTAT 
GCGACCGGAC GCCAGAACGG CTGGATGAGC GCTAACGATA TCAGGGAGCT GGAAAATCTC 
GACCGTATCC CGGAGGAGGA AGGCGGCGAC CTGTATCTTA TAAACGGCAA CATGACCAAG 
CTCAAGGACG CAGGCATTTT TGCAGCCTCG TCTCAGGGAC AGGAGGAGCC AGATGAAACA 
GAAGAATCAA AACAAGAGCC GGAACAGCCA CAGCAAAGTG AGCGCACCCG GCCACGAAAG 
AAGGAGGCAC TATGA

Protein sequence

MSIFSGLFRS RDKPKDATSG SSYRFFFGGT TSGKAVTERS AMQMTAVYSC VRILSEAIAG 
LPVHLYRYDG SGGKEKATTH PLYFLLHDEP NPEMTSFVFR ETLMTHLLLW GNAYAQIIRN 
GKGEVVALYP LMPNRMTVDR DADGHLYYEY QTSQDEAHTM DGSRVRLSPS DVLHIPGLGF 
DGLMGYSPIA MAKNAIGMAI ACEEYGAKFF ANGATPGGIL EHPGVIKDPE RVRESWNSAF 
GGSANANKVA VLEEGMKYTP ISISPEQAQF LETRKFQINE IARIFRIPPH MIGDLEKSSF 
SNIEQQSLEF VKYTLDPWVC RWEQSMQRAL LSMDEKKEYF FKFNVDGLLR GDYQSRMNGY 
ATGRQNGWMS ANDIRELENL DRIPEEEGGD LYLINGNMTK LKDAGIFAAS SQGQEEPDET 
EESKQEPEQP QQSERTRPRK KEAL