Gene Apar_1341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1341
Symbol
ID	8414229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	1509240
End bp	1510364
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	48%
IMG OID	645022941
Product	FHA domain containing protein
Protein accession	YP_003180356
Protein GI	257785139
COG category	[T] Signal transduction mechanisms
COG ID	[COG1716] FOG: FHA domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00287423
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTTTC TTAGTGACTT TGAAAACCGT ATTGGTTCGG TCTTTGGTGC CGCACCTCAA 
GGATATGCAG AGCCCTTCTC TTTTAAGAAG CTAGCCAAAC GTGCAGCTAA AGAGATGGAA 
CGTGAGACCT ATGAAATCGA CGGTGTAGAC ACTGCACCTG CCTTGTATAC CGTTTTAGTT 
GCTCCTCAAG ATGATTCACT GATGCGTCCT CTTTATGCTG ATCTAACTGC AGAGATTTCT 
AACTTTGTGG CTACTCAGGC TCAGCAAAAA GATTATGTGT TTGTAGGTCA ACCTCTTGTT 
CGTTTTATGG TTGATCCTTC TCTAAAACCT GGAAAATTTG CCGTCTTTGC AGAAAATGTT 
GATGGCAATA CTCTTGACCA GCTGCGTAAT GAAGAGCGTG CTTTCTTGGG CGGAAACTCC 
AGTGTTGGAG GAGCTGCGGC ACAGATGCCT CAACAACACA ATTCCCGCGC TACTGTTCGA 
CCAGAATCAC AGCCAGAGCC AGATCCGTTG TCTGTAGTTC GACCTGTTTC TGCAGATAAT 
GCAACGCCAG AGGTGTTGGG TGATCTTGCT GGTACAGATG CCGGTCTTGC GGTAATGCCA 
CCAGATTTTG TTGAGGCTCA AGGTGCAATT CCTGTTGTTT CTGCAGCTGA ATCCACCCCT 
ATGCCTGTTC TTCCTAGCTC AAATGAACTT CCAGACCTTC CAGTAAACGG TGCTATCCCA 
ACAGCAGCTC CCGTTCCTAT GACTCAGCGT CGTATCACAC CTTCTCTTGA TGCGCAGCTT 
AATGGCATAG GTGGACGTTC TTCTCGCAAT TTGCAAGGCA CGCCACGCGC AAATATGGAC 
GCTATCTGCA TCTTAATTGA TCGTCAGAGT GGACGTTCGT ATCGTGTTGA GGCTCCTCGC 
GCTATCATTG GTCGTGAGCG TTCTCAAGCA GACATTGTTC TGCGTGATCC CAACGTTTCA 
AGACGTCATG CTGAAATGAC CTACGACGGT CACGATTGGC ACATTGCTGA TTTGCACTCC 
ACCAACGGAA CGCTAGTCAA CGATATCGAC GTAGATGAGG TTATTCTGCG CGATGGAGAC 
CTTATTACCA TTGGTCTTAT GGACCTTCAG TTCCGGGAGA ACTAA

Protein sequence

MSFLSDFENR IGSVFGAAPQ GYAEPFSFKK LAKRAAKEME RETYEIDGVD TAPALYTVLV 
APQDDSLMRP LYADLTAEIS NFVATQAQQK DYVFVGQPLV RFMVDPSLKP GKFAVFAENV 
DGNTLDQLRN EERAFLGGNS SVGGAAAQMP QQHNSRATVR PESQPEPDPL SVVRPVSADN 
ATPEVLGDLA GTDAGLAVMP PDFVEAQGAI PVVSAAESTP MPVLPSSNEL PDLPVNGAIP 
TAAPVPMTQR RITPSLDAQL NGIGGRSSRN LQGTPRANMD AICILIDRQS GRSYRVEAPR 
AIIGRERSQA DIVLRDPNVS RRHAEMTYDG HDWHIADLHS TNGTLVNDID VDEVILRDGD 
LITIGLMDLQ FREN