Gene Franean1_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1045
Symbol
ID	5669459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1225088
End bp	1226158
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	76%
IMG OID	641239974
Product	LAO/AO transport system ATPase
Protein accession	YP_001505407
Protein GI	158312899
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1703] Putative periplasmic protein kinase ArgK and related GTPases of G3E family
TIGRFAM ID	[TIGR00750] LAO/AO transport system ATPase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.172221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCGG GCTCCGCCGG GGTCGCTCCA GCCGGGCCGG CGAGATCCGG GCCGGCGATA 
GCCGGGCGGG CGCGCGCCGC GCGCCCGAGC CCGGCGGAGC TCACTACCGC CGCCCTGGCC 
GGTGACCGGC GCGCGGTGGC CCGCCTGATC TCGCTCGTCG AGGACGAATC TGACGCCCTG 
CGCGAGGTGA GCGCCCTGCT TGCCCCGCAC ACCGGCCGCG CCCGGGTGAT CGGTCTGACC 
GGGGCTCCCG GGGTGGGGAA GTCGACGTCC ACCTCGGCGC TGGTCGGCGC CTTCCGGGCT 
CGCGGGCTGC GGGTGGGCGT GCTCGCGATC GACCCGAGCT CCCCGTTCAC CGGCGGCGCG 
CTGCTGGGCG ACCGGGTCCG GATGGTCGAG CACGCCACCG ACCCGGATGT GTTCGTCCGC 
TCCCTGGCCA CCAGGGGCAA CCTCGGCGGG CTGTCCTGGG CCACCCCACA GGCGCTGAGG 
GTCCTCGACG CGGCCGGCTT CGACATCGTG CTGATCGAGA CCGTCGGTGT CGGCCAGGCC 
GAGGTGGATG TCGCCTCGCT GGCCGACACC ACGCTGGTCC TGCTCGCCCC GGGCATGGGG 
GACGGGATCC AGGCGGCCAA GGCCGGCATC ATGGAGATCG CCGACATCCT CGTCGTCAAC 
AAGGCCGACC GTCCCGGCGC CGACCACACC TACCGCGACC TTGTCGCCGC CGTCCGGATG 
GCCGGTGGCA CGGCGGCCGG TGGGGCGGCG GAAGCCGGCT GGCGGCCCGA GGTCGTGCGG 
CTCGAGGCCG CGACCGGGAA GGGCGTGCCG GAGCTCCTGG ACGCGATCGA GCGCCACCGC 
GACTGGCTGC GGACGTCCGG TGAGCTCGAA CGCCGCCGGC TGCACCGCGC GGCCGAGGAG 
ATCTCCCAGA TCGCCCTGGC CGGCATGCGG GCCCGGCTGG GCAGGCTCAA CGGCGCGGCC 
CAGCTGGCCG ACCTGGCCCG CCAGGTCACC TCCGGCCGCC TCGACCCCTA CACCGCGGCC 
GCCACCCTCC TGGCCGCCAT CCCCGACCCC CACCTCCCGC GCTCCGGGTG A

Protein sequence

MSAGSAGVAP AGPARSGPAI AGRARAARPS PAELTTAALA GDRRAVARLI SLVEDESDAL 
REVSALLAPH TGRARVIGLT GAPGVGKSTS TSALVGAFRA RGLRVGVLAI DPSSPFTGGA 
LLGDRVRMVE HATDPDVFVR SLATRGNLGG LSWATPQALR VLDAAGFDIV LIETVGVGQA 
EVDVASLADT TLVLLAPGMG DGIQAAKAGI MEIADILVVN KADRPGADHT YRDLVAAVRM 
AGGTAAGGAA EAGWRPEVVR LEAATGKGVP ELLDAIERHR DWLRTSGELE RRRLHRAAEE 
ISQIALAGMR ARLGRLNGAA QLADLARQVT SGRLDPYTAA ATLLAAIPDP HLPRSG