Gene Daud_0665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0665
Symbol
ID	6027070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	697187
End bp	698365
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	61%
IMG OID	641593494
Product	poly-gamma-glutamate synthesis protein (capsule biosynthesis protein)
Protein accession	YP_001716831
Protein GI	169830849
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0459157
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGCT TGCGCCGCGT TACCATCTGG TGGCTCTTGG TTTTCTTCTG CCTCTGCCCG 
CCGGGCGGCT GTACGGGCTT GGATTCCACC GGTCCTACCG TTGACGGGCC CCCGGTTCCG 
CCTGCGCCTC AGGAGGTCCG GATCACCATC ACCGCGGTGG GAGATTTCCT GATGCACTTG 
CCGGTGATTT ATTCGGTGCA CAACCCGGAA ACAGGCCGTT TCGAATTCGG CGAAGTATTC 
GGCCCGGTCA GGCACCTGTT CGCAGACGCC GACTACTCCA TCGCCAACCT CGAAACCCGC 
CTGGCCGGGG CGCATAGGGG TTATTCGGGC TACCCGCGGT TCAACTGTCC CGCCGACCTC 
GCGCCGGAAA TGCGGGACGT GGGGCTGGAT ATGTTCTTGA CGGCTAACAA CCACAGCCTG 
GATCAGGATG TGGAAGGAGT GCTGGCCACC ATCCGGCACC TGGAGGCCGC CGGCCTGGAC 
CATATCGGCA CCTACGCCAG CCGGGAGGAC CGGGAACGGC CCTTCATCAA AGAACTCCGG 
GGAATTCGGG TGGGGATCAT GAACTACACC GAATCCACCA ACGGCCTACC GATCCCTCCC 
GACAAGCCGT ACCTGGTGAA CATAATCGAC CGTGGGGCCT TGCAGGAGGA AATCACCCGG 
CTTAAGGAAG CCGAGGCGGA TATCATCATC GCCTGTCTCC ATTTCGGCGT CGAGTACAGC 
CGCTATCCCA CCAAAGACCA GAGAGGTCTC GTGGAGTTTT TATTCAATTC GGGGGTCGAC 
ATCGTGCTGG GCAGTCACCC GCACGTGGTG CAGCCCACCC ATACCAGGAC GGTACTTAAG 
GAGGGGGTGC CCAGAAAGAA ATTCGCGGCC TACTCCCTGG GGAACTTCAT CTCCAATCAG 
CGCTGGCGTT ACAGTGACAG CGGCCTGCTG GTCCGGCTGA CCATCAAAAA GGACCTCGTC 
GGCGGCATAA CTGTTTTGGA GGAGGTGGAA CTGGTTCCCG TGTGGGTCCA CACCTATCTG 
TTGCACGGCA AGGTGCGCTA CCGGGTGCTT CCGGTCCACC AGGCCATTCC GGCCTTCGCG 
AATGAGGAGG ACCTCCTGCT CACTTCCGCT GACTACGAAC GGCTGCTACA GGTGGCCGAG 
GAAATGGGAC CGGACTTTCT GGTTGAACCG GCCTGGTGA

Protein sequence

MIRLRRVTIW WLLVFFCLCP PGGCTGLDST GPTVDGPPVP PAPQEVRITI TAVGDFLMHL 
PVIYSVHNPE TGRFEFGEVF GPVRHLFADA DYSIANLETR LAGAHRGYSG YPRFNCPADL 
APEMRDVGLD MFLTANNHSL DQDVEGVLAT IRHLEAAGLD HIGTYASRED RERPFIKELR 
GIRVGIMNYT ESTNGLPIPP DKPYLVNIID RGALQEEITR LKEAEADIII ACLHFGVEYS 
RYPTKDQRGL VEFLFNSGVD IVLGSHPHVV QPTHTRTVLK EGVPRKKFAA YSLGNFISNQ 
RWRYSDSGLL VRLTIKKDLV GGITVLEEVE LVPVWVHTYL LHGKVRYRVL PVHQAIPAFA 
NEEDLLLTSA DYERLLQVAE EMGPDFLVEP AW