Gene WD0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD0441
Symbol
ID	2738017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	-
Start bp	424704
End bp	425912
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	33%
IMG OID	637172645
Product	ankyrin repeat-containing protein
Protein accession	NP_966230
Protein GI	42520315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGGGA TATTTATGAA GAATATTTTA TATTTTATAT TATTAGCTGT CGTATTCGGA 
TCACCCATCC TGTTTGCCGT AGAGCAGCTT GAAGAAAAGA AAATTGAATC AGTTCATAAA 
AACGAAAATG TATGTGTAAG GAAGCAAGAT AGCACAAATC AAAAAGATGA GTTAAAAAGC 
AACGTCGATG CTAAACAAAC ACAAGAGGCT GAGAGCAAAA GATTAGACGG CACTACCGAT 
AAAGAGAAAC TGCAACACAA CGAGAACAAA GCTTTCGTGG TTGAAAAAAC TATAAGTGAA 
GGTGAAAGGA TTGATAAAGA TTTGCCAAAT GACCAGCTAG AAGGAAGCAC AGACAAATTT 
GCTCAAAATT TACCAAATGT GGCCAATAAA GAAGTGAATA AAGATTTGAA ACCAGAGCCT 
TTGCCTTTAA GTGCTGATTT AAATGAGAAT ACAGCTAACC CGCAAAAAAA TCTACAAGCT 
GATCAGAAGA TTGATATAAA AGATAATGAA CTTTCAAAAA GTGATGCGAG TCAATTATTA 
GAGGGAAAAA AAGAAAAAGT AGAGAATCAG TCTGAAGAAA AAAAAGTGAA AGAAACAAAC 
AGTAATTCCA AGGACCGCAA TAGAGTAAAA CCTATAACTA AAAAAGATGA AGAAGAGCAA 
AGTGAAAAGA AAAGTTTACA AAAATGGACA AAGCTAAACA GAGAACCAAT AAAAGAATGG 
GGTCATAAAG ACATACAAAG CAAGTCAATA TATAAACGAC AATATGATAG CCTTAATGAG 
CATCTTCCTA CAACTGTGTT TATTGATGAT TACAGTAAGC AATTTTTTTA CTGCATTAAG 
AAGAACAACT TAACTTGCTT AAGAGGAGTA ATAAGTAAGC TAGAAAAAAT TGGATTAACA 
ATTCAAGAGA TACTAAGGTT TAGAAACAAA TTGGGTGATA CTCCTCTCAT TTATTCAGTT 
AAACAAGGTG AGGTAGACAT AGTGCGCTTT CTCTTATTAC AAGGTGCTGA TCTTAGAGTA 
GTTAACAATA ATTTTCAATC CCCAATTGAT ATAGCAATCG AAAAAAAGCA GATCAATATA 
ATAAATGCGA TTGCCGAAAT GATGCCACAT CTTTTGGAGG ATAGAAAAAT AGACAATAAA 
GAAAGCTCAG CAATGTACGA TTGGGCTGTG AAAACGAAAG AAATACAGTG CGATAAGCAA 
GATGATTAG

Protein sequence

MLGIFMKNIL YFILLAVVFG SPILFAVEQL EEKKIESVHK NENVCVRKQD STNQKDELKS 
NVDAKQTQEA ESKRLDGTTD KEKLQHNENK AFVVEKTISE GERIDKDLPN DQLEGSTDKF 
AQNLPNVANK EVNKDLKPEP LPLSADLNEN TANPQKNLQA DQKIDIKDNE LSKSDASQLL 
EGKKEKVENQ SEEKKVKETN SNSKDRNRVK PITKKDEEEQ SEKKSLQKWT KLNREPIKEW 
GHKDIQSKSI YKRQYDSLNE HLPTTVFIDD YSKQFFYCIK KNNLTCLRGV ISKLEKIGLT 
IQEILRFRNK LGDTPLIYSV KQGEVDIVRF LLLQGADLRV VNNNFQSPID IAIEKKQINI 
INAIAEMMPH LLEDRKIDNK ESSAMYDWAV KTKEIQCDKQ DD