Gene Daro_0639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0639
Symbol
ID	3568906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	701114
End bp	702829
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	56%
IMG OID	637679082
Product	type II secretion system protein E
Protein accession	YP_283866
Protein GI	71906279
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02538] type IV-A pilus assembly ATPase PilB

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCAA CCCCTCAAAA TCCTCCACTT AGCGGCTTGG CGCGCGCGCT CGTCCAGGCC 
GGACATCTCA AGGAGGTAGA GGCGGAACAA TTGCTGGCCC AGGCCCACAG CACCAAGACT 
TCGCTGATCG AACAGATCAT TACAAGCCAG AAATCCAGTG CAATCGACAT AGCGCGCTTT 
GTCGCCGATA CCTTTGGCTA TCCACTACTT GACCTCAACG CTTTCGATGA AGCCCACATT 
CCGTCGGATG CCATCGACCG TAAGCTGATT GCGACGCACA AGGTCATTCC ACTCAACAAG 
CGCGGAAACC GTTTATCGGT AGCAATTGCT GACCCAACCA ACCTTCGTGC GCTGGACGAA 
ATTCGCTTCC AGACCGGTCT GGCTGTCGAT CCGATTGTCG TCGAACACCC AAAACTGGCG 
CCGCTCGTCA ACAAATATGC CGAGACAGCC GCCGAAGCGC TGAAAAACTT CACCAGCGAG 
GATCTCAACC TCGATTTTCT GGACGAAGAA ACCTCCAGCA AAGCTGACGA AGCCGCAGGG 
CAGGAAATCG ATGACGCACC GGTCGTCAAA TTCATCCAAA AAATGCTGCT CGATGCCATC 
AATGATGGAG CATCGGACAT CCATTTCGAA CCATACGAAA AGTTTTATCG CATTCGCTTC 
CGCGTCGACG GCATCCTGCG CGAAGTAGCC ACTCCACCGC TGGCCATCAA GGAAAAAATT 
GCCTCGCGCA TCAAGGTCAT TTCCCGGCTT AATATCGCCG AAAAGCGCGT CCCGCAGGAC 
GGCCGGATGA AACTGGTGCT TTCGAAGACC CGTGCCATCG ATTTCCGGGT CAGCACACTA 
CCGACGCTTC AGGGCGAGAA AATCGTTATG CGTATTCTCG ACCCAAGCTC AGCCACCTTG 
GGCATCGAGG CGCTAGGCTA CGAGCCGGAG CAAAAAGCAG CAATAATGGA CGCCATCAGC 
CGCCCCTATG GGATGGTACT GGTCACCGGA CCGACAGGTT CTGGCAAAAC CGTTTCGCTC 
TACACCTGCC TCAACATCCT GAATAAGGAT GGCATCAACA TTTCGACAGC GGAAGACCCG 
GCTGAAATCA ATCTACCGGG TGTCAATCAA GTCAACGTCG ACGACCGTGC TGGCCTGACC 
TTCCCTGTCG CACTAAAGGC ATTCCTGCGC CAGGATCCGG ACATCATCAT GGTCGGCGAA 
ATTCGTGACC TGGAGACCGC CGAGATTTCC ATCAAGGCGG CACAAACGGG TCACCTGGTG 
CTCTCGACGC TGCACACCAA CGATGCCCCG CAAACACTGA CTCGACTGAT GAACATGGGC 
GTCCCCATGT TCAATATCGC CTCCAGCGTG CTGTTGATCA CCGCTCAGCG CTTGGCGCGA 
CGGCTATGCA ACTGCAAGAA ACCGATGACC GTACCCGACC AGGCACTACT GGATGCAGGC 
TACTCGGAAG CCGATCTCGA CGGTTCGTGG ACGCTGTTTG GCCCAGGAGG ATGTGAACGG 
TGCAAAGGGA CCGGCTACAA GGGACGGGTC GGCATTTATC AGGTCATGCC CATTTCCGAA 
GCTATGCAAC GCATGATCAT GAGCGGCGCA TCTGCACTGG ACTTGGGCGC CCAAGCGAAA 
GCCGAAGGCG TGAAAAACCT CCGCGAATCC GGACTATTAA AAGTCAAACA AGGTGTGACC 
TCGCTTGACG AGGTGCTCAG CACCACCAAC GCTTAA

Protein sequence

MAATPQNPPL SGLARALVQA GHLKEVEAEQ LLAQAHSTKT SLIEQIITSQ KSSAIDIARF 
VADTFGYPLL DLNAFDEAHI PSDAIDRKLI ATHKVIPLNK RGNRLSVAIA DPTNLRALDE 
IRFQTGLAVD PIVVEHPKLA PLVNKYAETA AEALKNFTSE DLNLDFLDEE TSSKADEAAG 
QEIDDAPVVK FIQKMLLDAI NDGASDIHFE PYEKFYRIRF RVDGILREVA TPPLAIKEKI 
ASRIKVISRL NIAEKRVPQD GRMKLVLSKT RAIDFRVSTL PTLQGEKIVM RILDPSSATL 
GIEALGYEPE QKAAIMDAIS RPYGMVLVTG PTGSGKTVSL YTCLNILNKD GINISTAEDP 
AEINLPGVNQ VNVDDRAGLT FPVALKAFLR QDPDIIMVGE IRDLETAEIS IKAAQTGHLV 
LSTLHTNDAP QTLTRLMNMG VPMFNIASSV LLITAQRLAR RLCNCKKPMT VPDQALLDAG 
YSEADLDGSW TLFGPGGCER CKGTGYKGRV GIYQVMPISE AMQRMIMSGA SALDLGAQAK 
AEGVKNLRES GLLKVKQGVT SLDEVLSTTN A