Gene Apar_0510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0510
Symbol
ID	8413361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	588153
End bp	589751
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	51%
IMG OID	645022080
Product	putative PAS/PAC sensor protein
Protein accession	YP_003179532
Protein GI	257784315
COG category	[S] Function unknown
COG ID	[COG2461] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0555672
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGG TTCTTGATTT AAGCAAATCC GTTTATGAGA TTTGCACTAA GTTTCCCGTC 
ATTAAAGGCC TTATGGCAGA AAACGGCTTT GCCGAGATTA CCGAGCCAGG CCGCCTTCAG 
ACCATGGGCC GTTTTATGAC CATTCCTAAA GGCTGTGACC ACAAAGGCGT AGACCTTGAG 
GAGCTCAAGG CAATTTTCCG CTCTCACGGC TTTACTATTC TTGGTGATGA GGAGCCTATA 
GCTGCAGACA CTCCATCTGA CGAGAAACCC GCAGACACAG AGGCAACTGA CGCACCTATT 
GCACAAACCC CTAAGGAGCG CAAAGCTCTT ATCGCCCAGT ATCTTGAGCG CCTCAACGAC 
GGTGAGGACA TCGAGGCTGT TCGTGAGGAC TTTGCTCGTA ACTTCAAGGA TGTCTCTGGA 
TCTGAGATCT CTACCGCTGA GCAGGAGCTT ATCGCTGGCG GTGTTCCTAT GGAGAAGGTC 
TTGAAGCTCT GCGACGTTCA CGCTGCTCTC TTTGAAGGAA AGGTCTCTTG TGCACCAACA 
GGCGCTGCTG AAGAGACTCC TGGACATCCT GTTTGGACCA TGCGCCAAGA AAACGACCGC 
ATTCTTGCCT TTATTCACGA CCGCGTTGCT CCAGATGTAA GACGTGCTCG CACGCTTAAC 
GAGTCTTCCA GCAATGAAGA GTGCGCTGGT GTTGCAGCAA TTCTAAAGGC TGATATGGAC 
GCCTTTGACG AGGTCTTTGT TCACTACAAA CGCAAGGAAG AGCTGCTCTT CCCTCACCTG 
GAGCGTCACG ATATTACCGG TCCTTCAAAG GTTATGTGGG GCAAAGACGA CGAAGTAAGA 
AACGCCGTTA ACGGCGCAGA GGCTCTGCTT GAGACTGCTT ATGGTCAGTA TGATGCTGGT 
CTTATGGCAG GCGTTGCTGA CTATCTGGAT GAAGCTATTG AAGGCGCTGA GTCCATGGCT 
TCCAAGGAAG AGAACGTCCT TATTCCACTT TCCCTTGAGC ACCTAACTGC CACCCAGTGG 
ACCCAAATTG CTGCTGAAGA GAACGAGTTT GGCCACGCAT TTGGCGTCAA TCCACCTTCA 
TGGCATGCAG ATCCTCTTGA GCTTGCAAAT GACAAACTCA AAGAAATGGA AGCTGCAGGT 
GCTATGGGCG AGAATAACGC TGAGGCAGAA GAGGAAGCAA TTTCTGCTGA TGGAAAGGTT 
AAACTCTCTA CCGGTGAGTT CACCATTCCT CAGCTTGAGG CTGTTTTTGC AACCATTCCG 
CTTGACATTA CCTTTGTTGA TGCAGACGAT AAAACCCGTT ACTTCAGCCA CGGCGACACC 
CGCGCCTTCC CTCGTCCAAA GAGTTGCCTT GGTCGCGACG TCTACGATTG TCATCCACCA 
AAGAGCCAAG AAGCTGTTCG CCGTATCCTC ACCGAGTTCA AGAGCGGCAA GCGTGATTGC 
TCTGAGTTCT GGTTTGAAGT CAAAGACAAG TTCCTCTATG TCCGTTACTT TGCTGTCCGC 
GATGAAAAGG GCAACTACCT GGGCGCTCTT GAGACCACTC AAGACATCGG ACCAATCCGT 
GCCCTTGAGG GAGAAAACCG CAGAGGCTCT GACAGTTAA

Protein sequence

MAQVLDLSKS VYEICTKFPV IKGLMAENGF AEITEPGRLQ TMGRFMTIPK GCDHKGVDLE 
ELKAIFRSHG FTILGDEEPI AADTPSDEKP ADTEATDAPI AQTPKERKAL IAQYLERLND 
GEDIEAVRED FARNFKDVSG SEISTAEQEL IAGGVPMEKV LKLCDVHAAL FEGKVSCAPT 
GAAEETPGHP VWTMRQENDR ILAFIHDRVA PDVRRARTLN ESSSNEECAG VAAILKADMD 
AFDEVFVHYK RKEELLFPHL ERHDITGPSK VMWGKDDEVR NAVNGAEALL ETAYGQYDAG 
LMAGVADYLD EAIEGAESMA SKEENVLIPL SLEHLTATQW TQIAAEENEF GHAFGVNPPS 
WHADPLELAN DKLKEMEAAG AMGENNAEAE EEAISADGKV KLSTGEFTIP QLEAVFATIP 
LDITFVDADD KTRYFSHGDT RAFPRPKSCL GRDVYDCHPP KSQEAVRRIL TEFKSGKRDC 
SEFWFEVKDK FLYVRYFAVR DEKGNYLGAL ETTQDIGPIR ALEGENRRGS DS