Gene Acid345_0519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0519
Symbol
ID	4069939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	640368
End bp	641864
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	58%
IMG OID	637982524
Product	hypothetical protein
Protein accession	YP_589598
Protein GI	94967550
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0828452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGAA TGGCGGTTAC CATCTCTGCA CTACTCTTTT GTGTCAGCAC GTCGCTGGCG 
CAACAAAACG CCACAACGGA CCCCGACCTC CAGGAGTTGA AACAACAGTT GCGAGATGTG 
GTCTCCTCGC TTCAGGAGAC GCGTAGCGAG CTTAAGGAGT CGCAGCGGCA GATCCAGGCT 
CTGCAAACAG AGGTAGCCTC TCTGCGCGCG ACGAACGCGC CGCCGAGCAA TACTCCCTCG 
GCCTCGCCCG AGACCACTCC GACCTCAACC GAACTCGCGG ACCGTGTGAC CACTCTGCAA 
GAGCAGCAGG CGCTGCTGTC GACGAGAGTT GACCAGCAAT ACCAGACGAA GGTTGAGAGC 
GGATCGAAAT ATCGCGTACG TCTTTCTGGG ATGGTGCTGT TCAATGCCTC GGGAACTCGC 
GGCGAAGTGG ACGATCAGGA TGTTCCGATG CTCGCCGAAG GGCACACACC TGGACACTCC 
GGCGGAAATA TTTCAGCCAC CATGCGCCAG ACGTTCATTA ACCTCGACCT CTTCGGTCCT 
GACCTGGCGG GTGCACGCAC GTCTGCCTCA ATGCAATTCG ACTTCATGGG TGGATTCCCG 
AATACGCTTG ATGGCGTTGC GATGGGCATC GTGCGCATGA AGGTCGCGAA GGCCCAACTC 
GACTGGCAGA ACTGGTCGTT GAGCGTCGGC CAAGACAAAC CGTTTATCTC ACCGTATTCG 
CCGACCTCTC TCGCAACTAT CGGAACGCCT AGCTTTGGGT ATTCCGGAAA TCTCTGGACC 
TGGACACCAC AAATCGTCGC CGAGCGCCGA TGGAAACCGT CGGAGAGCCT ATCAACCAAG 
CTGCAATTTG GCATGCTTGA TCCCCTTAGT GGCGAACTGC CCGGGGATTC CTTTGGCCGG 
TATCCGGAAT CTGGGGAACG GTCGCGCGTT CCGGCGTTTG CGGCGCGCCA GAGTTTCGAT 
TTCGGAAGCG GTACAGAAAA ATCATCGATC GGGTTTGGCG GCTATTATGC GCGTCATGAC 
TTCGACTTCA ACCGAACGGT TGACGGTTGG GCGGCAACGC TCGATTGGAA GGTCGCACTG 
GGGCGTTATT TCGAAGATAG CGGCGCCTTC TACCGTGGGC GCGCGGTGGG CGGTCTTTGG 
GGCGGCATCG GGACGACGGC GGTGATGGAC GGTTACCTAA GCGATCCGCT GACCCACGTC 
TATCCGGTCA ACAGCATTGG GGGATGGTCG CAGCTTAAGT ACAAGCCTGC TCCCAAGTGG 
GAAATTAACG CGGCCTTCGG CGAAGACAGT CCATTTGCGG CTGACCTTCG GCTGGACAAC 
GCACCATACT CGTACCGCCC GTATTTGCGG AACTGGACTA CTATGTTCAA TGTGATCCAG 
CGGCCTCGAT CGAACCTTAT GTTCTCGCTC GAGTACCGCC ACCTGAATAG CGTCGAATTC 
AGCGGCCAAC GAGATACGGC CGAGCACGTC AATCTAGGTG TAGGAGTGAT CTTCTAA

Protein sequence

MRRMAVTISA LLFCVSTSLA QQNATTDPDL QELKQQLRDV VSSLQETRSE LKESQRQIQA 
LQTEVASLRA TNAPPSNTPS ASPETTPTST ELADRVTTLQ EQQALLSTRV DQQYQTKVES 
GSKYRVRLSG MVLFNASGTR GEVDDQDVPM LAEGHTPGHS GGNISATMRQ TFINLDLFGP 
DLAGARTSAS MQFDFMGGFP NTLDGVAMGI VRMKVAKAQL DWQNWSLSVG QDKPFISPYS 
PTSLATIGTP SFGYSGNLWT WTPQIVAERR WKPSESLSTK LQFGMLDPLS GELPGDSFGR 
YPESGERSRV PAFAARQSFD FGSGTEKSSI GFGGYYARHD FDFNRTVDGW AATLDWKVAL 
GRYFEDSGAF YRGRAVGGLW GGIGTTAVMD GYLSDPLTHV YPVNSIGGWS QLKYKPAPKW 
EINAAFGEDS PFAADLRLDN APYSYRPYLR NWTTMFNVIQ RPRSNLMFSL EYRHLNSVEF 
SGQRDTAEHV NLGVGVIF