Gene Aasi_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1041
Symbol
ID	6377048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1348633
End bp	1350090
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	34%
IMG OID	642682157
Product	hypothetical protein
Protein accession	YP_001958118
Protein GI	189502401
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.880803
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTACT TTAATGTAGA TGCTATAATC GTATATGCTT TTTTGTTGCT GATTTTACTA 
CTAGGTTTAT GGGCAGGAAA AAATGTTAAG ACTATTAAAG AATATGCAAT TGCGAATAGA 
GCATATGGGA CTGGTATATT AACAATAACT ATGCTAGCTA CCTTTATTAC AGGTTCACAA 
TCTATAGGCT ATATAGGATA TATATATGAT GATGGAATTT TGCCTGTAAT TCCGATAATT 
TTTTGCAGGG CTATAATTGG TTTCTTGTTT ATTGCACACT ATATATCCCC TAAAATTTTA 
TATTTCGAGG GGTGCTTAAC ATTAGCAGAG GTTATGGGAA AACTATATGG TGGTATGGCC 
CGGACCTGGA TAGGCTTTTT AGGTGTCCTT TATTGCTTGG CTTTTGTTAT ACTGCAAATT 
ATCTGGATGG GATACATCGG AGAGCTTATT AATGTTCCCA ATCAGTGGGG TATGCTATTA 
GGAGGCGCTT TTTTAATTAT CTATTCTGCC AGGGGTGGTA TGAAGTCAAT AACTATTACC 
GATATATTAC AATTTATCTC TATTACTATG TTAGTAACTT TAGCAGTTAA TGTACTAATT 
CATAAAATAG GAGGTATAGA TAATATATTC AATAAAGTTC CAACAAATAC TTTTAAAATC 
TTTCAGAACC CTAACTTCAA GAATTATCTA GTTTATTGTT TATGGGGGGC ATTCCCTTCC 
TATTTAGTCA GCTTCCCATT CATCCAGCGT ATGCTCATGG CTAAGGATAA AAGGCAGCTT 
GCCAAGAGTC AATATATAGG AATGTCTTAC TTAACAATCT TCTATATGTC TCTTACTTTG 
ATTGGTTTAG CTGCTATAGC ATTGAAAACA ATAGGAGATG TCAATATGCC TAAGCAAGGA 
AGCAGAGTCT TTATATACTT GGTTGAGGCT TATTTTCCTG TGGGTATAAA GGGGATCATT 
AGTATAGGCT TATTGGCTGC TGTTATGTCT ACAGCAGATT CTTTCTTGCA TAGTGCAGGT 
ATTTTAATAG CTTATGATGT AGTACAACCT TTATTAGCAA AGAAATATGA GGTTAATGTT 
TTAAGGACAA GCCAGTACGC AACATTTTTT CTTGGAGTAA TATCTTTAGG AGTAGCATTA 
ATTTACGATA TACTGCCTCG TGTGCAATAT GGAACTATGG ATTTAGGAAA AGGAATAAAT 
ATACTGAGAG ATTTTGTTGC TGTCGTGTTT ACCATTCCTC TTTTGGCCGG TATTATGGGC 
CTTAAAACAG ATGCTAAATC GTTTTTTGTT TCTATGATCG CTACTTTTAT TGCTTTTTTT 
ATAGGTAGGT TATTTTTGCC TGATTTGTGG TTTATGCCTA TGGTTATTGC AGTCAACAGT 
ATCACATTTT TTGCTACTCA TTATATTCAG AATAAAGGAT TTGTAACTGT AAAACGTGGT 
ACTGTTGTTT TATCTTAA

Protein sequence

MNYFNVDAII VYAFLLLILL LGLWAGKNVK TIKEYAIANR AYGTGILTIT MLATFITGSQ 
SIGYIGYIYD DGILPVIPII FCRAIIGFLF IAHYISPKIL YFEGCLTLAE VMGKLYGGMA 
RTWIGFLGVL YCLAFVILQI IWMGYIGELI NVPNQWGMLL GGAFLIIYSA RGGMKSITIT 
DILQFISITM LVTLAVNVLI HKIGGIDNIF NKVPTNTFKI FQNPNFKNYL VYCLWGAFPS 
YLVSFPFIQR MLMAKDKRQL AKSQYIGMSY LTIFYMSLTL IGLAAIALKT IGDVNMPKQG 
SRVFIYLVEA YFPVGIKGII SIGLLAAVMS TADSFLHSAG ILIAYDVVQP LLAKKYEVNV 
LRTSQYATFF LGVISLGVAL IYDILPRVQY GTMDLGKGIN ILRDFVAVVF TIPLLAGIMG 
LKTDAKSFFV SMIATFIAFF IGRLFLPDLW FMPMVIAVNS ITFFATHYIQ NKGFVTVKRG 
TVVLS