Gene Anae109_3756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3756
Symbol
ID	5375897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	4379149
End bp	4380699
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	71%
IMG OID	640845278
Product	tetratricopeptide TPR_4
Protein accession	YP_001380919
Protein GI	153006594
COG category	[S] Function unknown
COG ID	[COG1729] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0867818
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCGA AGACTCGGAT CTCGGTCGTC CTGCTCGCCC TCACCGCGGC CTGTGCAACG 
GGCGGCGGCG GGAAGGGGCC CAGCGAGCGG TTCTACCAGG CGACCTACAA GCTCCCCGCC 
CCCAGCCAGC TCGAGGACGC CGAGCGCGGG AAGATCAAGG ACGCGGGGAC GCACTACGAT 
CGCGGCCTCG TGGCGCAGCA GTCCGGCAAC ATCGACCAGG CGCGCGCCGA GTGGGCCACT 
GCCGCCCAGG GCTACGCCGA CTTCGCCGAT CAGTTCCAGT CGTCCGAGTG GCGCCTCCCG 
ATCCGCTTCC GCGCCGCCGA GCTCTACATG CAGGCGCAGC AGTTCGAGCG CGCCGCGGAG 
CAGGCCCAGA AGGTGGTGGC CGATCCCCAG TCGGACGCCT CGTCGAAGGC CGTCGGCTCG 
CGGCTCGCCG CCGGCGCGTG GCTCAACGTC GCGAACCAGA AGGTGAAGGC GAGCCAGCTC 
GAGCCGATCC GGCTCGCGAA CGCCGACCAG CGCCGAGGGC AGCCCCTGCA GCCGCGCGTC 
CCGCCGGGAG AGTGGAAGCG CTTCGTCGAC TCCGCGGACG TGTACCTCCA GAACCTCGAG 
GCGGACCCGG AGACGAAGAA GCCGGCCGCC GAGCGCCGCG GCGGCCTGCC GCCCGCGCAG 
CTCGCGCTCA TCGCCGCCGA GGTCGAGTAC GCGTTCGACA ACATGGAGGA CGCCCGCCGC 
CGCTTCGCGG ACATCCTGAG CCGCTGGCCG GAAGAGGGGG AGGTGCTGGA GAGCGCGGTG 
CCGCTCTACC TCCAGACCTT CCTGTTCGCG AACGACGACC AGGGCTACCA GGCCGAGGTC 
GCCCGCATCC GCGAGCAGGT GCAGGCCCAG GCGCAGAAGG CGACGGACCC GAAGCAGAAG 
GAGAGCTACG ACAAGGTCCT CGAGGCGCTC TCCCGCGCCG AGGCGGGTAC CCACTTCGCG 
GCCGCCCAGA AGCTGCTCGA CGAGGGCAAG CCCGCCGAGG CCGCCCAGGC CTTCGAGAAG 
CTCGCGGCCG ATCCGCGCGG CGGCGACGCG GCGAACGCGC TCCACAACGC CGCGGTGGCC 
TGGGACAAGG CCGGCAAGGC GGATCGCGCC GCCGAGATCC GCGAGCGGAT CCTGAAGGAG 
CACGCGGACA GCAAGGTCGC GGGGAACAAC ATGCTGCTCC TCGCCGTCAA CAAGTCGAAG 
AAGAACGACC ACTCGGGGGC GGCCAAGCTG TACGACGACT TCATCGCGAG GTACCCGGAC 
TCGCCGAACC GGTGCGTGGC CCTCCAGAAC GTCGCCTCCG AGCTCGACCT CGCGAAGAAG 
GCGGCGCCGG CCGCGGAGCG GTACGTCACC TTCGGCAAGG ACGAGAAGTG CGCGAGCGCC 
GACCCGAACG TCGCCGCCCG CGCGCTGTAC CGGGCCGGCC GCCTCTACGA GGACGCGAAG 
CAGAAGGCGA AGGCCAAGGA GGCCTACGCC GCGGCGATCG CGCTCCCGGG GGTGACCGAC 
ACGGTCGCGA AGAGCCAGCT CGACGACGCC AAGCGCCGGA TGAAGAAGTA G

Protein sequence

MTSKTRISVV LLALTAACAT GGGGKGPSER FYQATYKLPA PSQLEDAERG KIKDAGTHYD 
RGLVAQQSGN IDQARAEWAT AAQGYADFAD QFQSSEWRLP IRFRAAELYM QAQQFERAAE 
QAQKVVADPQ SDASSKAVGS RLAAGAWLNV ANQKVKASQL EPIRLANADQ RRGQPLQPRV 
PPGEWKRFVD SADVYLQNLE ADPETKKPAA ERRGGLPPAQ LALIAAEVEY AFDNMEDARR 
RFADILSRWP EEGEVLESAV PLYLQTFLFA NDDQGYQAEV ARIREQVQAQ AQKATDPKQK 
ESYDKVLEAL SRAEAGTHFA AAQKLLDEGK PAEAAQAFEK LAADPRGGDA ANALHNAAVA 
WDKAGKADRA AEIRERILKE HADSKVAGNN MLLLAVNKSK KNDHSGAAKL YDDFIARYPD 
SPNRCVALQN VASELDLAKK AAPAAERYVT FGKDEKCASA DPNVAARALY RAGRLYEDAK 
QKAKAKEAYA AAIALPGVTD TVAKSQLDDA KRRMKK