Gene PCC8801_4414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4414
Symbol
ID	7104860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4640364
End bp	4642394
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	45%
IMG OID	643477393
Product	TrkA-N domain protein
Protein accession	YP_002374492
Protein GI	218249121
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0569] K+ transport systems, NAD-binding component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACCCA GTGGAAACCC ATCTCCACAC CGTAATCTGC CTCAACCAGA CAGCGATCGC 
TTTTTAGTCT GTGGGTTAGG CAGTTTAGGA CAACATTGTG TCCTCTCCCT CAAGGAATTT 
GGGGTAAAAG TAACAGCCAT AGAACAAATT GAACCGAAAA CCTGGGAAAT TCCTAATATC 
CCTGAATTAC TCGACGATTT AATCATTGCC GACTGTAGAC AAAATCAGAT TTTACAACAG 
GCAAAAATAG AACGCTGTCG CGCCGCCTTA TTAGTCACCA CCAACGAACA AGCGAACATC 
GAAACCGCCT TAGCCATTCG TCAACTGAAC CCCCACACCC GCTTAATTGT TCGTTCTCCC 
AAAGAAAACC TCAATCAACT GTTGAGTGAA CAACTGGGGA ACTTTATCGC CTATGAACCC 
ACCCAACTAC CGGCCGCTGC CTTTGCGATC GCCGCGTTAG GAACACAAAC CCGTGGCTTT 
TTTAGCCTTG ATCGCCAACA ATTGCGGGTC ATTCAGCGTC GTTTGACCCC CAATGATCCT 
TGGTGTCATG TCCGTCCCTT ACATGACCTC AATACCCGAA ACCGTCGCTT AATCGGGTAT 
CATGACGGAG AAGATCATCC CTCGGTGAGT TTCTACTATT GGGACCCAGA TACCGTTGTT 
AAACCTGGAG ATCAACTGAT CTACATTGAA ACAACCGACA CCCTACTACA ACCTGTTTCA 
ATGTCTTCGG TTCAATCTTC CCAACACCCT CAAAGACAAT TTTGGCAAAA TTGGCGCGAA 
CGTCTCAAAA AGTTATGGCA AAAAGGACGA CAACGCATCC GACAAATTGC CTTGATCAGT 
GGTTTAATTG TGATTGTTCT GTTAATTATT GGAACGTTGT TATTGCATTG GAATTTCCCC 
CAAAGTACCT TACTTTCGGC TTTTTCTGCC ACGGCAATTT TATTATTAGG TGGATATTCT 
GATCTGTTTG GAGAATTTGA ACAAATGGAT GATATTCCTC CCTGGTTGCA GTTATTTAGT 
TTGGGGTTAA CCTTAGCAGG AACAGCTTTT GTCGGGGTTT TATATGCCTT ACTCACAGAA 
ACCCTTTTAT CAGCGCAATT TCAGTTTGTT AAACAGCGTC CCCCCATTCC CCAAGCCAAT 
CATATCCTCA TCATAGGACT AGGAAGAGTC GGCCAACAAG TGGCTGAGTT TCTATTGGAA 
TTGAAACAAA CGTTGTTAGG AATTACCTTT AATTTAGAGT TAGATTCGAC TATTTTGCCA 
GAAATGCCCC TCATTGTGGG GAATGTTCAA AACGTCCTGC CTCAAGCCAA TTTAGCCACC 
GCTAAGAGTG TTGTTGTGGT GACGGATGAT GAAATTCTCA ACCTAGAAGT CGCCTTAATG 
TCCCAAAAAC TGAACCCTGA CAGTCACATC GTCATTCGGA CAGCCGGACA AGCGTTAGGA 
CAGCATTTAT TGCCCATTTT GCCAAAAGCC CAAATTTTGG GAACCTATGC GGTGGCCGCA 
GAAGTGTTTG CCGGGGCAGC TTTCGGGGAA AATATTATTA CAGTCTTTCG CCTCAATAAT 
CGGACGGTGT TGGTGACAGA ATACGAAGTT GAGGAAGAGG ATACCCTCAA TGGCTTGTTA 
TTGGCAGAGA TTGCCTATGG CTATGGAGTT CTTCCTATCT TGCATCAAAA GCCCCCTAAT 
GCCTCAAATT TGATGCCCTC CGATGATATT CGGTTGGGGG TAGGCGATCG CTTGGTCGTC 
TTAGCTACCA TTGAAGACTT AAAGCGAGTT GAACAGGGAA AAATTGCCAT TCAACCCAAA 
CAATGGCGCA TTAGAGTTGA AAAGGCGTTT AACGATGAGG CTGCTTTTGA GGGGGCGAAT 
GCGATCGCTC GTATTTCGGG TTGTTCTTTG AATATAGCAC GAACACTCAT GGAACAGTTA 
CCCGCGACTT TATCGGTTCC CCTTTATCAC CATCAAGGGT TACGATTAGT ACGCGAATTG 
CATAAATTAC GGGTGACGTC AGCATTAATT CCGATTCAAG TAAGTCGTTA A

Protein sequence

MEPSGNPSPH RNLPQPDSDR FLVCGLGSLG QHCVLSLKEF GVKVTAIEQI EPKTWEIPNI 
PELLDDLIIA DCRQNQILQQ AKIERCRAAL LVTTNEQANI ETALAIRQLN PHTRLIVRSP 
KENLNQLLSE QLGNFIAYEP TQLPAAAFAI AALGTQTRGF FSLDRQQLRV IQRRLTPNDP 
WCHVRPLHDL NTRNRRLIGY HDGEDHPSVS FYYWDPDTVV KPGDQLIYIE TTDTLLQPVS 
MSSVQSSQHP QRQFWQNWRE RLKKLWQKGR QRIRQIALIS GLIVIVLLII GTLLLHWNFP 
QSTLLSAFSA TAILLLGGYS DLFGEFEQMD DIPPWLQLFS LGLTLAGTAF VGVLYALLTE 
TLLSAQFQFV KQRPPIPQAN HILIIGLGRV GQQVAEFLLE LKQTLLGITF NLELDSTILP 
EMPLIVGNVQ NVLPQANLAT AKSVVVVTDD EILNLEVALM SQKLNPDSHI VIRTAGQALG 
QHLLPILPKA QILGTYAVAA EVFAGAAFGE NIITVFRLNN RTVLVTEYEV EEEDTLNGLL 
LAEIAYGYGV LPILHQKPPN ASNLMPSDDI RLGVGDRLVV LATIEDLKRV EQGKIAIQPK 
QWRIRVEKAF NDEAAFEGAN AIARISGCSL NIARTLMEQL PATLSVPLYH HQGLRLVREL 
HKLRVTSALI PIQVSR