Gene Acid345_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1899
Symbol
ID	4073361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2279703
End bp	2281388
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	59%
IMG OID	637983909
Product	hypothetical protein
Protein accession	YP_590974
Protein GI	94968926
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.131383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000892254
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGCCACTAC GTCGCCGATT CACGGCCTTC GTGTACCTGC TGATGTTTGG CCTGCTCCTC 
CCGCACGTCG CGCACGCGCA GAAGAAGCCT GCATCCGCGA AGCCCGCTGG ATCCCCCGCT 
CTCCAATCTG CCATTCGCGC CGGACAGCTC CCCGACATGC GTTGGCCCAA CTTCTCCGAC 
TATCGCGTCC AGATCGATAA CTTCTACAAG GCGTCGAACT ACTCTCTCGC GTGGATTGAA 
GCTGGCACGC CGACCGACCA CGCCCGCCAG ATGATCGCGA TCCTCAGCGC TGCCGACTCA 
CAAGGTCTCA ACGCCGAAGA TTACGACGGA CTCCGCTGGC CTGACCGCAT CTCGAAGCTC 
GCTGCTGCAC ACGCGCCTGA AGACGAGGAC GTCTTCGATC TCGCGCTCAC CGTCAGCACC 
ATGCGTTACA TATCCGACAT GCATATCGGC CGCATCAATC CCACCCACTT CCAGTTCGGC 
CTCGATGTGG AACACAAGAA GCTCGATCTC CCCAGCTTCG TACGCAACAT GCTCAGTTCA 
CCTGACGACC TCACGCACAC AATCGCCAAG GTAGGCCCAC CGTTCGCCGG ATACGAAGCC 
ACCCGCCAGG CCATGCTGCA GTACACCCAA CTAGCCAAGC AGCCCGATAC CGAGAAACTC 
CCGCTTCCGG TCGGCGTGGT GTACCAGGGC GGCTACTACG ACCACATGCC CGCCCTCGCC 
AAGCGCCTCC AGCAACTTGG TGACCTCGAT CCCAAAGTCA TCATCCTGGC GGATGCGATC 
AAATACGACG ACCCTCTCAT GGGCGGCGTC GCGCACTTCC AGTCGCGTCA CGGCCTGCCC 
AATGACGGCA ATCTCACCTC CGACACGATC GATGCGCTGA ACATACCCAT CGCCGATCGC 
CTCGAGCAGC TAAAGCTCGC GCTCGAGCGC TATCGCTGGA TCCGCTATCA ATTCACTTCA 
CCTCCTGTCG TGGTCAACGT GCCGGAGTTC AAGCTCTTCG GCTATGACGG AAGCGGCACG 
CAGATCCTAT CCATGGGGGT GAATGTTGGC GACGCCTTCG ATTTTCAGAC GCCTATCTTC 
GAAGGTGACA TCCGCTATAT CGTCTTCCGG CCCTATTGGT ACGTGACGCC CACGATCCAG 
CGCGACGAGA TGGTGCCCTC TGTCGAAGAA GACCGCACCT ATCTCGAACA GAATGAAATG 
GAGGTCGTGG ATAAGGACGG CAAGGTCATC GCCTCCGGCG CAATCTCAGA CGCAGTGCTC 
AAGCACCTGA AGAACGGCTC GTATTCGATC CGTCAGCGTC CAGGCGCGGA CAATGCGCTC 
GGCCTCGTGA AGATCATCTT TCCTAACTCG CATAACGTTT ATCTGCACGA CACGCCTGAG 
TTCAAGACCA TGTTCTCGAA GGCACCGCGT GCATTGAGCC ACGGATGCAT CCACCTCGAA 
AAGCCCGCCG ATCTCGCCTA CTGGCTCTTG CGCGACAAGA CCGATTGGTC GCTGGACAAA 
GTGAAAGAAG CCATGCAGCA CGGACGCGAC AACTCCAGCG TGACCCTTAC TAAGCCCGTG 
CCGATCCTCA TCCTCTACGT AACCGCCCGC GCCCAGACCA ATGGCACTGT CCAGTTCTTT 
AAAGATATCT ACGGCCACGA CGTCGAACTC AAAGCTGCGC TGGCGAAGGG CTATCCGTAT 
CCGTAG

Protein sequence

MPLRRRFTAF VYLLMFGLLL PHVAHAQKKP ASAKPAGSPA LQSAIRAGQL PDMRWPNFSD 
YRVQIDNFYK ASNYSLAWIE AGTPTDHARQ MIAILSAADS QGLNAEDYDG LRWPDRISKL 
AAAHAPEDED VFDLALTVST MRYISDMHIG RINPTHFQFG LDVEHKKLDL PSFVRNMLSS 
PDDLTHTIAK VGPPFAGYEA TRQAMLQYTQ LAKQPDTEKL PLPVGVVYQG GYYDHMPALA 
KRLQQLGDLD PKVIILADAI KYDDPLMGGV AHFQSRHGLP NDGNLTSDTI DALNIPIADR 
LEQLKLALER YRWIRYQFTS PPVVVNVPEF KLFGYDGSGT QILSMGVNVG DAFDFQTPIF 
EGDIRYIVFR PYWYVTPTIQ RDEMVPSVEE DRTYLEQNEM EVVDKDGKVI ASGAISDAVL 
KHLKNGSYSI RQRPGADNAL GLVKIIFPNS HNVYLHDTPE FKTMFSKAPR ALSHGCIHLE 
KPADLAYWLL RDKTDWSLDK VKEAMQHGRD NSSVTLTKPV PILILYVTAR AQTNGTVQFF 
KDIYGHDVEL KAALAKGYPY P