Gene Acid345_4433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4433
Symbol
ID	4070915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5264948
End bp	5266114
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	58%
IMG OID	637986471
Product	hypothetical protein
Protein accession	YP_593507
Protein GI	94971459
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0480068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAGGA GTGTCACCGT GAAATTCGCA TGGGCCGCAA TTCTTCTTCT GATGTTCTCG 
ATCGTGGCTG CCGCACAGGA AACTTCGGAA GTCGCGACTC CTCCCAATGG CGACAATCAG 
CACGCATCCG TCTCGCAATG GATTGGCCCA GTGAAAATCT CCATCGACTA CCACAGTCCC 
AGGGTCCACA ACCCCGCGGA GAACGATCGC ACCGGCCACA TCTGGGGAGA ACTGGTGCAC 
TACGGCTTCG TCGACGAGGG CTTTGGCCCG ACGCAGGCCG CGCCCTGGCG TGCCGGTGCG 
AACGAGAGCA CCGCCATCAC CTTCTCTCAC GACGTGAAAG TCGAAGGCAA AGACCTGAAG 
GCCGGGACCT ACGCGCTCTT TCTCGATGTG GAGAAAACTA GCCCCTGGCA GTGGATCTTC 
TCTAACCACC AGGGCTGGGG AAGTTTTCAA TACGATCGCA AGGATGACGT TCTGCGCGTC 
CCCGTCGCTG CGCAGGACGC ACCGTTCACC GAATTCCTCA CGTACGGCTT CGACGATCGC 
CGGCCGGATT CCGCGGTGGC TTACCTGCAA TGGGAAAAGA AGCGGGTCCC CTTCAAAGTT 
GAGGTTCCCA ATGTGAAGGC GCTCTATGTC GCGAAGATGC GTCAGGACCT GCAATCGTGG 
GCGGGATTCA ACTACCAGGA CTGGCAGACC GCCGCGCAAT TCTGTGCAGA TAACAAGATC 
AATCTCGAGG AAGCGCTGAC CTGGGCGGAC AAGGCGATCA ACGGCCCATT CCGTGGCGCG 
ACCATTGGAC ACGAGGAGTT TGCCACTCTC TCCACCAAAG CAGCCGTGCT GAGCGCCATG 
GGCCGTGAAG CGGATGCCGA CAGCGTGATG GACAAAGCCC TGCATCTGCG CGCAACCGAC 
GCGTACTCCG TTTATGCCTA TGGCATGGGA CTACTGCGCA ACGACAAAAA AGACAAAGCG 
ATGAAGGCAT TCACGTTCAA TCAGCAGCAA CATCCGGAAG ACAAGTTCTG GACCGCGCTG 
GGACTCGCTC GCGGCTACTC CGCTAACGGC GACAAGAAGA ATGCAATCGC GAATTGGGAA 
ATCGTGGTGA AGAACGTGCC CGCCAACCTG AGCAACCGAA CCGCCGGATA CGAGGCAGCG 
CTGAAGAAAT TGAAAGAGGC GATCTGA

Protein sequence

MDRSVTVKFA WAAILLLMFS IVAAAQETSE VATPPNGDNQ HASVSQWIGP VKISIDYHSP 
RVHNPAENDR TGHIWGELVH YGFVDEGFGP TQAAPWRAGA NESTAITFSH DVKVEGKDLK 
AGTYALFLDV EKTSPWQWIF SNHQGWGSFQ YDRKDDVLRV PVAAQDAPFT EFLTYGFDDR 
RPDSAVAYLQ WEKKRVPFKV EVPNVKALYV AKMRQDLQSW AGFNYQDWQT AAQFCADNKI 
NLEEALTWAD KAINGPFRGA TIGHEEFATL STKAAVLSAM GREADADSVM DKALHLRATD 
AYSVYAYGMG LLRNDKKDKA MKAFTFNQQQ HPEDKFWTAL GLARGYSANG DKKNAIANWE 
IVVKNVPANL SNRTAGYEAA LKKLKEAI